spark:大数据集群计算的生产实践pdf电子书籍下载百度网盘-捕鱼10元起上10元下


 

spark:大数据集群计算的生产实践中文版百度网盘电子版百度云下载

《spark:大数据集群计算的生产实践》涵盖了开发及维护生产级spark应用的各种方法、组件与有用实践。全书分为6章,第1 ~ 2章帮助读者深入理解spark的内部机制以及它们在生产流程中的含义;第3章和第5章阐述了针对配置参数的法则和权衡方案,用来调优spark,改善性能,获得高可用性和容错性;第4章专门讨论spark应用中的安全问题;第6章则全面介绍生产流,以及把一个应用迁移到一个生产工作流中时所需要的各种组件,同时对spark生态系统进行了梳理。

《spark:大数据集群计算的生产实践》不会讲述入门级内容,读者在阅读前应已具备spark基本原理的知识。《spark:大数据集群计算的生产实践》适合spark开发人员、spark应用的项目经理,以及那些考虑将开发的spark应用程序迁移到生产环境的系统管理员(或者devops)阅读。


书籍作者简介:
ilya ganelin 从机器人专家成功跨界成为一名数据工程师。他曾在密歇根大学花费数年时间研究自发现机器人(self-discovering robot),在波音公司从事手机及无线嵌入式dsp(数据信号处理)软件开发项目,随后加入capital one 的数据创新实验室,由此进入大数据领域。ilya是apache spark核心组件的活跃贡献者以及apache apex的提交者(committer),他希望研究构建下一代分布式计算平台。同时,ilya还是一个狂热的面包烘焙师、厨师、赛车手和滑雪爱好者。 ema orhian 是一位对伸缩性算法充满激情的大数据工程师。她活跃于大数据社区,组织会议,在会上发表演讲,积极投身于开源项目。她是jaws-spark-sql-rest(sparksql数据仓库上的一种资源管理器)的主要提交者。ema一直致力于... ilya ganelin 从机器人专家成功跨界成为一名数据工程师。他曾在密歇根大学花费数年时间研究自发现机器人(self-discovering robot),在波音公司从事手机及无线嵌入式dsp(数据信号处理)软件开发项目,随后加入capital one 的数据创新实验室,由此进入大数据领域。ilya是apache spark核心组件的活跃贡献者以及apache apex的提交者(committer),他希望研究构建下一代分布式计算平台。同时,ilya还是一个狂热的面包烘焙师、厨师、赛车手和滑雪爱好者。 ema orhian 是一位对伸缩性算法充满激情的大数据工程师。她活跃于大数据社区,组织会议,在会上发表演讲,积极投身于开源项目。她是jaws-spark-sql-rest(sparksql数据仓库上的一种资源管理器)的主要提交者。ema一直致力于将大数据分析引入医疗领域,开发一个对大型数据集计算统计指标的端到端的管道。 kai sasaki 是一位日本软件工程师,对分布式计算和机器学习很感兴趣。但是一开始他并未从事hadoop或spark相关的工作,他最初的兴趣是中间件以及提供这些服务的基础技术,是互联网驱使他转向大数据技术领域。kai一直是spark的贡献者,开发了不少mllib和ml库。如今,他正尝试研究将机器学习和大数据结合起来。他相信spark在大数据时代的人工智能领域也将扮演重要角色。他的github地址为:https://github.com/lewuathe。 brennon york既是一名特技飞行员,也是一位计算机科学家。他的爱好是分布式计算、可扩展架构以及编程语言。自2014年以来,他就是apache spark的核心贡献者,目标是通过发展graphx和核心编译环境,培育一个更强大的spark社区,激发更多合作。从为spark提交贡献开始,york就一直在用spark,而且从那个时候开始,就使用spark将应用带入生产环境。

pdf书籍目录:
第1章 成功运行spark job 1
第2章 集群管理 21
第3章 性能调优 59
第4章 安全 93
第5章 容错或job执行 117
第6章 超越spark 159

上一篇 2022年7月5日 下午1:54
下一篇 2022年7月5日 下午1:54

猜你喜欢

网站地图