新書推薦:
《
逆风翻盘 危机时代的亿万赢家 在充满危机与风险的世界里,学会与之共舞并找到致富与生存之道
》
售價:NT$
625.0
《
工业互联网导论
》
售價:NT$
445.0
《
木偶的恨意(法国悬念大师米歇尔普西悬疑新作)
》
售價:NT$
295.0
《
孤独传:一种现代情感的历史
》
售價:NT$
390.0
《
家、金钱和孩子
》
售價:NT$
295.0
《
形而上学与测量
》
售價:NT$
340.0
《
世界航母、舰载机图鉴 【日】坂本明
》
售價:NT$
340.0
《
量价关系——透视股票涨跌脉络
》
售價:NT$
340.0
|
內容簡介: |
準備好釋放潛藏在您資料中的力量了嗎?透過這本綜合技術大全,您將學會如何用ApacheHadoop來打造並維運一個可靠而具擴充性的分散式系統。無論是想瞭解如何分析各種大小資料集的程式設計師,或者想要設定與運行Hadoop叢集的系統管理員,都合適閱讀本書。
針對Hadoop2所做的這個改版,新增了YARN以及Hadoop相關專案的新章節,像是Parquet、Flume、Crunch及Spark。從這些新案例中,您可以了解Hadoop在健康照護系統以及基礎資料處理這些領域所扮演的角色。
.學習基礎元件如MapReduce、HDFS及YARN。
.更深入探索MapReduce,包含開發應用程式。
.設定及維護Hadoop叢集以使用HDFS及YARN上的Mapreduce。
.學習兩種資料格式:Avro的資料序列化和Parquet巢狀資料。
.使用資料攝取工具,如Flume(使用於串流資料)和Sqoop(使用於批量資料傳輸)。
.了解高階資料處理工具,如Pig、Hive、Crunch,以及Spark。
.學習HBase分散式資料庫以及運用ZooKeeper打造分散式服務。
|
關於作者: |
TomWhite
TomWhite自2007年起就是ApacheHadoop的提交者。他不僅是阿帕契軟體基金會的成員,同時也是Cloudera的工程師。他曾幫orielly.com、java.net與IBM的developerWorks撰寫技術文章,並在商業研討會上發表多場演講。
|
目錄:
|
第一部分 Hadoop基礎
chapter1|遇見Hadoop
chapter2|MapReduce
chapter3|Hadoop分散式檔案系統
chapter4|YARN
chapter5|Hadoop的IO
第二部分 MapReduce
chapter6|開發MapReduce程式
chapter7|MapReduce如何運作
chapter8|MapReduce的類型與格式
chapter9|MapReduce的特性
第三部分 Hadoop操作
chapter10|建立一個Hadoop叢集
chapter11|Hadoop的管理
第四部分 相關專案
chapter12|Avro
chapter13|Parquet
chapter14|Flume
chapter15|Sqoop
chapter16|Pig
chapter17|Hive
chapter18|Crunch
chapter19|Spark
chapter20|HBase
chapter21|ZooKeeper
第五部分 案例研究
chapter22|Cerner的可聚集資料
chapter23|生物資料科學:用軟體拯救生命
chapter24|Cascading
appendixA|安裝ApacheHadoop
appendixB|Cloudera的Hadoop發行套件
appendixC|準備NCDC氣象資料
appendixD|舊版及新版的JavaMapReduceAPI
index
|
|