spark大数据分析实战中文版百度网盘电子版百度云下载
本书一共11章:其中第1~3章,主要介绍了spark的基本概念、编程模型、开发与部署的方法;第4~11章,详细详解了热点新闻分析系统、基于云平台的日志数据分析、情感分析系统、搜索引擎链接分析系统等的应用与算法等核心知识点。
书籍作者简介:
高彦杰,毕业于*国人民大学,就职于微软亚洲研究院。开源技术爱好者,对spark及其他开源大数据系统与技术有较为深入的认识和研究,实践经验丰富。较早接触并使用spark,对spark应用开发、spark系统的运维和测试比较熟悉.深度阅读了spark的源代码,了解spark的运行机制,擅长spark的查询优化。 曾著有畅销书《spark大数据处理:技术、应用与性能优化》。 倪亚宇,清华大学自动化系在读博士研究生,曾于微软亚洲研究院、ibm研究院实习。对大规模的推荐系统和机器学习算法有较为深入的研究和丰富的实践经验。
pdf书籍目录:
第1章 spark简介 1
第2章 spark开发与环境配置 18
第3章 bs简介 30
第4章 lam架构日志分析流水线 58
第5章 基于云平台和用户日志的推荐系统 82
第6章 twitter情感分析 103
第7章 热点新闻分析系统 126
第8章 构建分布式的协同过滤推荐系统 146
第9章 基于spark的社交网络分析 162
第10章 基于spark的大规模新闻主题分析 180
第11章 构建分布式的搜索引擎 197