hadoop生态系统中文版百度网盘电子版百度云下载
《hadoop生态系统》本书每一章都介绍了不同的主题(例如核心技术或数据传输),并且解释了为什么特定组件适用或不适用特定的需求。对于数据处理来说,使用hadoop是一个全新的挑战,但如果有了这本便利的参考书,你将很容易领会使用hadoop的精妙所在。
主要包括如下主题:核心技术,hadoop分布式文件系统(hdfs)、mapreduce、yarn和spark。数据库和数据管理,cassandra、hbase、mongodb和hive。序列化,avro、json和parquet。管理和监视,puppet、chef、zookeeper和oozie。分析辅助,pig、mahout和mllib。数据传输,scoop、flume、distcp和storm。安全、访问控制和审计,sentry、kerberos和knox。云计算和虚拟化,serengeti、docker和whirr。
书籍作者简介:
kevin sitto是pivotal software公司的领域捕鱼10元起上10元下的解决方案工程师,主要为客户提供咨询服务,帮助客户理解和描述大数据需求。 marshall presser是pivotal data engineering集团的成员。他帮助客户使用hadoop、关系数据库和内存数据网格来解决复杂的分析问题。
pdf书籍目录:
第1章关键技术
第2章数据库及数据管理
第3章序列化
第4章管理与监控
第5章分析辅助
第6章数据传输
第7章安全、访问控制和审计
第8章云计算和虚拟化