hadoop应用架构中文版百度网盘电子版百度云下载
-使用hadoop进行数据存储和建模的着眼点和思路
-将数据输入、输出系统的最佳方案
-mapreduce、spark和hive等数据处理框架介绍
-数据去重、窗口分析等常见hadoop处理模式应用
-在hadoop上采用giraph、graphx等图形处理工具
-综合使用工作流以及apache oozie等调度工具
-以apache oozie、apache spark streaming和apache flume进行近实时流处理
-点击流分析、欺诈检验和数据仓库的架构案例
本书就使用apache hadoop端到端数据管理方案提供专业架构指导。其他书籍大多针对hadoop生态系统中的软件,讲解较为单一的使用方法,而本书偏重实践,在架构的高度详细阐释诸多工具如何相互配合,搭建出打磨之后的完整应用。书中提供了诸多案例,易于理解,配有详细的代码解析,知识点一目了然。
为加强训练,本书后半部分提供了详细的案例,涵盖最为常见的hadoop应用架构。无论是设计hadoop应用,还是将hadoop同现有数据基础架构集成,本书都可以提供详实的参考。
书籍作者简介:
mark grover apache sentry项目管理委员会成员,《hive编程指南》作者之一,曾参与apache hadoop、apache hive、apache sqoop以及apache flume等项目,并为apache bigtop项目和apache sentry(项目孵化中)项目贡献代码。 ted malaska cloudera公司的资深捕鱼10元起上10元下的解决方案架构师,致力于帮助客户更好地掌握hadoop及其生态系统。曾任美国金融业监管局(finra,financial industry regulatory authority)首席架构师,指导建设了包括网络应用、服务型架构以及大数据应用在内的大量捕鱼10元起上10元下的解决方案。曾为apache flume、apache avro、yarn以及apache pig等项目贡献代码。 jonathan seidman c... mark grover apache sentry项目管理委员会成员,《hive编程指南》作者之一,曾参与apache hadoop、apache hive、apache sqoop以及apache flume等项目,并为apache bigtop项目和apache sentry(项目孵化中)项目贡献代码。 ted malaska cloudera公司的资深捕鱼10元起上10元下的解决方案架构师,致力于帮助客户更好地掌握hadoop及其生态系统。曾任美国金融业监管局(finra,financial industry regulatory authority)首席架构师,指导建设了包括网络应用、服务型架构以及大数据应用在内的大量捕鱼10元起上10元下的解决方案。曾为apache flume、apache avro、yarn以及apache pig等项目贡献代码。 jonathan seidman cloudera公司的捕鱼10元起上10元下的解决方案架构师,协助捕鱼10元起上10元下的合作伙伴将的捕鱼10元起上10元下的解决方案集成到cloudera的软件栈中。芝加哥hadoop用户组(chicago hadoop user group)及芝加哥大数据(chicago big data)的联合创始人、《hadoop实战》技术编辑。曾任orbiz worldwide公司大数据团队技术主管,为最为繁忙的站点管理了承载海量数据的hadoop集群。也曾多次在hadoop及大数据专业会议上发言。 gwen shapira cloudera公司的捕鱼10元起上10元下的解决方案架构师,知名博主,拥有15年从业经验,协助客户设计高扩展性的数据架构。曾任pythian高级顾问、oracle ace主管以及nocoug董事会成员,活跃于诸多业内会议
pdf书籍目录:
第 1 章 hadoop 数据建模
第 2 章 hadoop 数据移动
第 3 章 hadoop 数据处理
第 4 章 hadoop 数据处理通用范式
第 5 章 hadoop 图处理
第 6 章 协调调度
第 7 章 hadoop 近实时处理
第 8 章 点击流分析
第 9 章 欺诈检测
第 10 章 数据仓库