apache spark源码剖析中文版百度网盘电子版百度云下载
《apache spark源码剖析》以spark 1.02版本源码为切入点,着力于探寻spark所要解决的主要问题及其解决办法,通过一系列精心设计的小实验来分析每一步背后的处理逻辑。
《apache spark源码剖析》第3~5章详细介绍了spark core中作业的提交与执行,对容错处理也进行了详细分析,有助读者深刻把握spark实现机理。第6~9章对spark lib库进行了初步的探索。在对源码有了一定的分析之后,读者可尽快掌握spark技术。
《apache spark源码剖析》对于spark应用开发人员及spark集群管理人员都有极好的学习价值;对于那些想从源码学习而又不知如何入手的读者,也不失为一种借鉴。
书籍作者简介:
许鹏长期致力于电信领域和互联网的软件研发,在数据处理方面积累了大量经验,对系统的可扩展性、可靠性方面进行过深入学习和研究。因此,累积了大量的源码阅读和分析的技巧与方法。目前在杭州同盾科技担任大数据平台架构师一职。对于linux内核,作者也曾进行过深入的分析。
pdf书籍目录:
第1章初识spark 3
第2章spark整体框架 15
第3章sparkcontext初始化 23
第4章spark作业提交 33
第5章部署方式分析 91
第6章spark streaming 131
第7章sql 173
第8章graphx 215
第9章mllib 239