新書推薦:

《
民国时期京剧名伶专集汇编(全4册)
》
售價:NT$
20298.0

《
创建教练文化:十字路口的组织升级
》
售價:NT$
347.0

《
量子力学 恩利克·费米
》
售價:NT$
245.0

《
马长寿内陆欧亚学文存(全三集)
》
售價:NT$
2030.0

《
银行业刑事风险防控与应对
》
售價:NT$
449.0

《
语言、使用与认知
》
售價:NT$
321.0

《
帝国的叙事话语:国家身份塑造与冷战时期美国外交政策 北京大学人文学科文库
》
售價:NT$
704.0

《
世界上的城堡:一部千年古堡兴衰史(从军事建筑到中世纪城堡,59座经典古堡,高清全彩图文,精装收藏品质)
》
售價:NT$
1214.0
|
內容簡介: |
準備好釋放潛藏在您資料中的力量了嗎?透過這本綜合技術大全,您將學會如何用ApacheHadoop來打造並維運一個可靠而具擴充性的分散式系統。無論是想瞭解如何分析各種大小資料集的程式設計師,或者想要設定與運行Hadoop叢集的系統管理員,都合適閱讀本書。
針對Hadoop2所做的這個改版,新增了YARN以及Hadoop相關專案的新章節,像是Parquet、Flume、Crunch及Spark。從這些新案例中,您可以了解Hadoop在健康照護系統以及基礎資料處理這些領域所扮演的角色。
.學習基礎元件如MapReduce、HDFS及YARN。
.更深入探索MapReduce,包含開發應用程式。
.設定及維護Hadoop叢集以使用HDFS及YARN上的Mapreduce。
.學習兩種資料格式:Avro的資料序列化和Parquet巢狀資料。
.使用資料攝取工具,如Flume(使用於串流資料)和Sqoop(使用於批量資料傳輸)。
.了解高階資料處理工具,如Pig、Hive、Crunch,以及Spark。
.學習HBase分散式資料庫以及運用ZooKeeper打造分散式服務。
|
關於作者: |
TomWhite
TomWhite自2007年起就是ApacheHadoop的提交者。他不僅是阿帕契軟體基金會的成員,同時也是Cloudera的工程師。他曾幫orielly.com、java.net與IBM的developerWorks撰寫技術文章,並在商業研討會上發表多場演講。
|
目錄:
|
第一部分 Hadoop基礎
chapter1|遇見Hadoop
chapter2|MapReduce
chapter3|Hadoop分散式檔案系統
chapter4|YARN
chapter5|Hadoop的IO
第二部分 MapReduce
chapter6|開發MapReduce程式
chapter7|MapReduce如何運作
chapter8|MapReduce的類型與格式
chapter9|MapReduce的特性
第三部分 Hadoop操作
chapter10|建立一個Hadoop叢集
chapter11|Hadoop的管理
第四部分 相關專案
chapter12|Avro
chapter13|Parquet
chapter14|Flume
chapter15|Sqoop
chapter16|Pig
chapter17|Hive
chapter18|Crunch
chapter19|Spark
chapter20|HBase
chapter21|ZooKeeper
第五部分 案例研究
chapter22|Cerner的可聚集資料
chapter23|生物資料科學:用軟體拯救生命
chapter24|Cascading
appendixA|安裝ApacheHadoop
appendixB|Cloudera的Hadoop發行套件
appendixC|準備NCDC氣象資料
appendixD|舊版及新版的JavaMapReduceAPI
index
|
|