新書推薦:
《
形而上学与测量
》
售價:NT$
340.0
《
世界航母、舰载机图鉴 【日】坂本明
》
售價:NT$
340.0
《
量价关系——透视股票涨跌脉络
》
售價:NT$
340.0
《
创伤与记忆:身体体验疗法如何重塑创伤记忆 [美]彼得·莱文
》
售價:NT$
295.0
《
复原力
》
售價:NT$
345.0
《
近代中国思维方式的演变(王中江著作系列)
》
售價:NT$
950.0
《
我可以近乎孤独地度过一生
》
售價:NT$
440.0
《
二十四节气生活美学
》
售價:NT$
340.0
|
編輯推薦: |
Hadoop、HBase、NoSQL数据库、云数据库、MapReduce、流计算、图计算、数据可视化,这些和大数据什么关系你都不知道,你就out拉!从不懂到清晰,这一本书足够!
适合大数据初学者的一本大数据书!
全面了解大数据领域知识,相关内容在新浪微博发布信息后有超过三十万次的浏览量
大数据作为继云计算、物联网之后IT行业又一颠覆性的技术,备受关注。大数据无处不在,包括金融、汽车、零售、餐饮、电信、能源、政务、医疗、体育、娱乐等在内的社会各行各业,都融入了大数据的印迹,大数据对人类的社会生产和生活必将产生重大而深远的影响。
“在很多领域,中国政府和中国的企业都有雄心勃勃的计划,这引起了全世界的关注,这些雄心和计划,现在应该拓展到大数据的领域。”--哈佛大学商学院访问教授、全球知名的管理咨询大师达文波特,专门为中国政经两界提示智库建言。
|
內容簡介: |
大数据作为继云计算、物联网之后IT行业又一颠覆性的技术,备受关注。大数据无处不在,包括金融、汽车、零售、餐饮、电信、能源、政务、医疗、体育、娱乐等在内的社会各行各业,都融入了大数据的印迹,大数据对人类的社会生产和生活必将产生重大而深远的影响。
大数据时代的到来,迫切需要高校及时建立大数据技术课程体系,为社会培养和输送一大批具备大数据专业素养的高级人才,满足社会对大数据人才日益旺盛的需求。本书定位为大数据技术入门教材,为读者搭建起通向“大数据知识空间”的桥梁和纽带。本书将系统梳理总结大数据相关技术,介绍大数据技术的基本原理和大数据主要应用,帮助读者形成对大数据知识体系及其应用领域的轮廓性认识,为读者在大数据领域“深耕细作”奠定基础、指明方向。在本书的基础上,感兴趣的读者可以通过其他诸如《Hadoop权威指南》等工具书,继续深入学习和实践大数据相关技术。
|
關於作者: |
林子雨,博士,厦门大学计算机科学系老师,中国高校首个"数字教师"的提出者和建设者。在数据库、数据仓库、数据挖掘、大数据、云计算和物联网等领域有着十多年的知识积累,对各个领域知识都有比较深入的了解,有比较宽泛的视野,将相关大数据知识综合成一本适合本科和研究生教学的教材。
|
目錄:
|
目录
**篇 大数据基础
第1章 大数据概述 2
1.1 大数据时代 2
1.1.1 第三次信息化浪潮 2
1.1.2 信息科技为大数据时代
提供技术支撑 3
1.1.3 数据产生方式的变革促成
大数据时代的来临 5
1.1.4 大数据的发展历程 6
1.2 大数据的概念 7
1.2.1 数据量大 7
1.2.2 数据类型繁多 8
1.2.3 处理速度快 8
1.2.4 价值密度低 9
1.3 大数据的影响 9
1.3.1 大数据对科学研究的影响 9
1.3.2 大数据对思维方式的影响 10
1.3.3 大数据对社会发展的影响 11
1.3.4 大数据对就业市场的影响 12
1.3.5 大数据对人才培养的影响 12
1.4 大数据的应用 13
1.5 大数据关键技术 14
1.6 大数据计算模式 14
1.6.1 批处理计算 15
1.6.2 流计算 15
1.6.3 图计算 15
1.6.4 查询分析计算 16
1.7 大数据产业 16
1.8 大数据与云计算、物联网 17
1.8.1 云计算 17
1.8.2 物联网 20
1.8.3 大数据与云计算、物联网的关系 24
1.9 本章小结 25
1.10 习题 25
第2章 大数据处理架构Hadoop 26
2.1 概述 26
2.1.1 Hadoop简介 26
2.1.2 Hadoop的发展简史 26
2.1.3 Hadoop的特性 27
2.1.4 Hadoop的应用现状 27
2.2 Hadoop的项目结构 28
2.2.1 Common 28
2.2.2 Avro 29
2.2.3 HDFS 29
2.2.4 HBase 29
2.2.5 MapReduce 29
2.2.6 Zookeeper 30
2.2.7 Hive 30
2.2.8 Pig 30
2.2.9 Sqoop 30
2.2.10 Chukwa 30
2.3 Hadoop的安装与使用 31
2.3.1 创建Hadoop用户 31
2.3.2 Java的安装 31
2.3.3 SSH登录权限设置 32
2.3.4 安装单机Hadoop 32
2.3.5 Hadoop伪分布式安装 33
2.4 本章小结 35
2.5 习题 36
第二篇 大数据存储
第3章 Hadoop分布式文件系统 40
3.1 分布式文件系统 40
3.1.1 计算机集群结构 40
3.1.2 分布式文件系统的结构 41
3.1.3 分布式文件系统的设计需求 42
3.2 HDFS简介 42
3.3 HDFS的相关概念 43
3.3.1 块 43
3.3.2 名称节点和数据节点 44
3.4 HDFS体系结构 45
3.4.1 概述 45
3.4.2 HDFS命名空间管理 46
3.4.3 通信协议 46
3.4.4 客户端 46
3.4.5 HDFS体系结构的局限性 46
3.5 HDFS的存储原理 46
3.5.1 冗余数据的保存 46
3.5.2 数据存取策略 47
3.5.3 数据错误与恢复 48
3.6 HDFS的数据读写过程 49
3.6.1 读数据的过程 49
3.6.2 写数据的过程 50
3.7 HDFS编程实践 51
3.7.1 HDFS常用命令 51
3.7.2 HDFS的Web界面 52
3.7.3 HDFS常用Java API及应用实例 53
3.8 本章小结 56
3.9 习题 57
第4章 分布式数据库HBase 59
4.1 概述 59
4.1.1 从BigTable说起 59
4.1.2 HBase简介 59
4.1.3 HBase与传统关系数据库的
对比分析 60
4.2 HBase访问接口 61
4.3 HBase数据模型 62
4.3.1 数据模型概述 62
4.3.2 数据模型的相关概念 62
4.3.3 数据坐标 64
4.3.4 概念视图 64
4.3.5 物理视图 65
4.3.6 面向列的存储 65
4.4 HBase的实现原理 67
4.4.1 HBase的功能组件 67
4.4.2 表和Region 68
4.4.3 Region的定位 69
4.5 HBase运行机制 70
4.5.1 HBase系统架构 70
4.5.2 Region服务器的工作原理 72
4.5.3 Store的工作原理 73
4.5.4 HLog的工作原理 73
4.6 HBase编程实践 74
4.6.1 HBase常用的Shell命令 74
4.6.2 HBase常用的Java API及
应用实例 76
4.7 本章小结 86
4.8 习题 86
第5章 NoSQL数据库 90
5.1 NoSQL简介 90
5.2 NoSQL兴起的原因 91
5.2.1 关系数据库无法满足Web 2.0的
需求 92
5.2.2 关系数据库的关键特性在Web 2.0
时代成为"鸡肋" 92
5.3 NoSQL与关系数据库的比较 93
5.4 NoSQL的四大类型 95
5.4.1 键值数据库 96
5.4.2 列族数据库 96
5.4.3 文档数据库 97
5.4.4 图形数据库 97
5.5 NoSQL的三大基石 98
5.5.1 CAP 98
5.5.2 BASE 100
5.5.3 *终一致性 101
5.6 从NoSQL到NewSQL数据库 102
5.7 本章小结 104
5.8 习题 104
第6章 云数据库 105
6.1 云数据库概述 105
6.1.1 云计算是云数据库兴起的
基础 105
6.1.2 云数据库的概念 106
6.1.3 云数据库的特性 107
6.1.4 云数据库是个性化数据存储
需求的理想选择 108
6.1.5 云数据库与其他数据库的关系 109
6.2 云数据库产品 110
6.2.1 云数据库厂商概述 110
6.2.2 Amazon的云数据库产品 110
6.2.3 Google的云数据库产品 111
6.2.4 微软的云数据库产品 111
6.2.5 其他云数据库产品 112
6.3 云数据库系统架构 112
6.3.1 UMP系统概述 112
6.3.2 UMP系统架构 113
6.3.3 UMP系统功能 115
6.4 云数据库实践 118
6.4.1 阿里云RDS简介 118
6.4.2 RDS中的概念 118
6.4.3 购买和使用RDS数据库 119
6.4.4 将本地数据库迁移到云端RDS数据库 123
6.5 本章小结 124
6.6 习题 125
第三篇 大数据处理与分析
第7章 MapReduce 128
7.1 概述 128
7.1.1 分布式并行编程 128
7.1.2 MapReduce模型简介 129
7.1.3 Map和Reduce函数 129
7.2 MapReduce的工作流程 130
7.2.1 工作流程概述 130
7.2.2 MapReduce的各个执行阶段 131
7.2.3 Shuffle过程详解 132
7.3 实例分析:WordCount 135
7.3.1 WordCount的程序任务 135
7.3.2 WordCount的设计思路 136
7.3.3 MapReduce的具体执行过程 136
7.3.4 一个WordCount执行过程的
实例 137
7.4 MapReduce的具体应用 139
7.4.1 MapReduce在关系代数
运算中的应用 139
7.4.2 分组与聚合运算 140
7.4.3 矩阵-向量乘法 140
7.4.4 矩阵乘法 141
7.5 MapReduce编程实践 141
7.5.1 任务要求 141
7.5.2 编写Map处理逻辑 142
7.5.3 编写Reduce处理逻辑 143
7.5.4 编写main方法 144
7.5.5 编译打包代码以及运行程序 144
7.6 本章小结 146
7.7 习题 147
第8章 流计算 151
8.1 流计算概述 151
8.1.1 静态数据和流数据 151
8.1.2 批量计算和实时计算 152
8.1.3 流计算的概念 153
8.1.4 流计算与Hadoop 153
8.1.5 流计算框架 154
8.2 流计算的处理流程 154
8.2.1 概述 154
8.2.2 数据实时采集 155
8.2.3 数据实时计算 155
8.2.4 实时查询服务 156
8.3 流计算的应用 156
8.3.1 应用场景1:实时分析 156
8.3.2 应用场景2:实时交通 157
8.4 开源流计算框架Storm 158
8.4.1 Storm简介 159
|
|