spark最佳实践中文版百度网盘电子版百度云下载
本书是spark实战指南,全书共分8章。前4章介绍spark的部署、工作机制和内核,后4章分别通过实战项目介绍spark sql、spark streaming、spark graphx和spark mlib功能模块。此外,本书详细介绍了常见的实战问题,比如大数据环境下的配置设置、程序调优等。本书附带的一键安装脚本,更能为初学者提供很大帮助。
书籍作者简介:
陈欢 腾讯资深程序员,15年编码经验,曾任职网络安全、互联网金融等部门,亲手从零建设了财付通业务的spark集群,并使之同时支持sql、实时计算、机器学习等多种数据计算场景。他目前就职于腾讯社交与效果广告部,从事大数据分析工作。 林世飞 腾讯资深研究员,2005年加入腾讯,先后在无线产品、安全中心、搜索平台、开放平台、社交与效果广告部等部门从事开发和团队管理工作。他对网络安全、搜索引擎、数据挖掘、机器学习有一定了解,热衷知识传播和分享,曾获腾讯学院2009年年度优秀讲师。目前,他就职于社交与效果广告部,负责广告系统相关的研发工作。
pdf书籍目录:
第1章 spark与大数据 1
第2章 spark基础 8
第3章 spark工作机制 58
第4章 spark内核讲解 77
第5章 spark sql与数据仓库 92
第6章 spark流式计算 122
第7章 spark图计算 149
第8章 spark mllib 169