新書推薦:
《
爱丁堡古罗马史-罗马城的起源和共和国的崛起
》
售價:NT$
349.0
《
自伤自恋的精神分析
》
售價:NT$
240.0
《
大宋悬疑录:貔貅刑
》
售價:NT$
340.0
《
不被大风吹倒
》
售價:NT$
300.0
《
人生解忧:佛学入门四十讲
》
售價:NT$
490.0
《
东野圭吾:分身(东野圭吾无法再现的双女主之作 奇绝瑰丽、残忍又温情)
》
售價:NT$
295.0
《
浪潮将至
》
售價:NT$
395.0
《
在虚无时代:与马克斯·韦伯共同思考
》
售價:NT$
260.0
|
內容簡介: |
大数据技术是以数据为本质的新一代革命性的信息技术,在数据挖潜过程中,能够带动理念、模式、技术及应用实践的创新。本书系统性地介绍了大数据的概念、发展历程、市场价值、大数据相关技术,以及大数据对中国信息化建设、智慧城市、广告、媒体等领域的核心支撑作用,并对对数据科学理论做了初步探索。
|
關於作者: |
赵勇 清华大学苏州研究院大数据处理中心技术总监,电子科技大学教授、极限网络计算与服务实验室主任,中国计算机学会大数据专家委员会委员。芝加哥大学博士,师从世界网格之父Ian Foster教授,毕业后任职美国微软公司搜索与广告部,从事云平台上的大型精准广告系统开发,获微软杰出员工奖。主要从事云计算、大数据、工作流方面的研究和开发。著译作有《云计算:资源管理调度》、《算法谜题》等11部,拥有十余项云计算及大数据相关的专利及软件著作权。
|
目錄:
|
第1章 大数据概述 1
1.1 大数据综述 2
1.2 大数据的定义 3
1.3 大数据的发展历程 4
1.4 大数据的战略意义 6
1.5 数据科学的兴起 8
1.6 如何开展大数据研究与应用 11
1.7 总结 13
参考文献 13
第2章 大数据市场 15
2.1 大数据的市场环境 17
2.2 大数据市场预测 20
2.3 大数据市场趋势 26
2.4 总结 32
第3章 大数据问题 33
3.1 大数据问题分类 34
3.2 大数据与云计算的辩证关系 40
3.3 大数据是一个不可多得的发展机遇 45
第4章 大数据与中国的信息化 51
4.1 大数据——棘手的难题 52
4.2 大数据如何落地中国 52
第5章 数据科学理论及方法论初探 63
5.1 数据生产要素理论 64
5.2 数据创新理论及其10项考量指标 65
5.3 数据科学理论的基础概念和基本特质初探 74
5.4 总结 76
第6章 大数据、互联网与社会进步和产业革命 79
6.1 互联网的思想及特质正在颠覆传统文化 和行业的发展观念 80
6.2 大数据与中国社会与经济的战略发展的契机 82
第7章 大数据技术 89
7.1 基础架构支持 91
7.2 数据采集 95
7.3 数据存储 97
7.4 数据计算技术 100
7.5 数据展示与交互 108
7.6 大数据技术变革及趋势 110
参考文献 112
第8章 云计算体系 117
8.1 云体系的五大方面 119
8.2 云时代的信息中枢 120
8.3 云时代的通信网络 123
8.4 云时代的智能终端 128
8.5 云时代的应用服务 132
8.6 云时代的安全隐私 137
8.7 总结 141
参考文献 142
第9章 Hadoop平台及相关生态系统 143
9.1 谷歌技术“三件宝” 144
9.2 Hadoop平台 146
9.3 Hadoop相关生态系统 156
9.4 Hadoop商业产品 168
参考文献 173
第10章 NoSQL 175
10.1 发展背景 176
10.2 CAP理论 177
10.3 商业数据库的变革 181
10.4 NoSQL数据库分类 184
10.5 列式存储 187
10.6 文档存储 197
10.7 key-value存储 204
10.8 Megastore 207
10.9 图数据库 211
10.10 总结 211
参考文献 212
第11章 行业大数据解决方案 215
11.1 “大数据”时代的行业应用 216
11.2 云工作流解决方案 218
11.3 集成方案 220
11.4 案例分析 230
11.5 总结 232
参考文献 233
第12章 大数据与数据挖掘 235
12.1 数据挖掘的基础知识和核心思想 237
12.2 数据挖掘的主要功能和常用算法 240
12.3 大数据时代的数据挖掘 243
12.4 在线推荐系统常用算法介绍 250
12.5 总结 266
第13章 大数据展示与交互 267
13.1 数据可视化分类 269
13.2 可视化技术分类 271
13.3 总结 288
第14章 大数据安全与隐私 289
14.1 安全与隐私问题凸显 290
14.2 云计算与大数据时代的安全挑战 292
14.3 如何解决安全问题 299
14.4 隐私问题 305
14.5 总结和展望 311
第15章 新型城镇化背景下的大数据与智慧城市 313
15.1 新型城镇化中智慧城市介绍 315
15.2 智慧城市中的大数据 316
15.3 智慧城市建设指导理论 319
15.4 智慧城市信息系统内容 321
15.5 总结 332
第16章 大数据与计算广告 333
16.1 互联网展示广告 334
16.2 展示广告的发展 338
16.3 互联网广告衡量指标 344
16.4 用户数据 347
16.5 基于大数据的广告定向 348
16.6 广告的未来 352
参考文献 353
第17章 大数据与智能电视关联业务模型 355
17.1 大数据在数字电视行业的分析方法 356
17.2 数字电视中的数据关系分析处理是构建关联电视应用的基础 363
17.3 “三网融合”的电视大数据与智慧家庭展望 365
第18章 大数据应用案例分析 369
18.1 “数据驱动开发”的大数据业务发展案例 370
18.2 大数据支撑政务活动 375
18.3 大数据增强社会服务能力 377
18.4 大数据提高商业决策水平 381
18.5 大数据的其他行业应用 387
18.6 总结 388
第19章 总结与展望 389
|
內容試閱:
|
前 言
经过一年多的筹划、讨论、摸索、资料收集和编写,这本书终于问世了。2013年被称为大数据元年,而维克托舍恩伯格所著的《大数据时代》一书,让大数据的理念和应用案例深入人心,引发了人们对大数据的强烈兴趣,并希望了解更多的关于大数据的知识。在2013年5月,我们开始策划这本书,其初衷就是为了帮助读者从理论、模式、具体的大数据技术及行业应用方面更加深入地理解和运用大数据。在这一年中,大数据本身也经历了迅猛的发展和充实,一方面是开源大数据技术的成熟和普及,另一方面是大数据行业鲜活应用的不断涌现。然而,所有这些都只是大数据威力的冰山一角,随着数据价值的日益凸显和数据的相互关联,大数据必将在未来几年带来全行业翻天覆地的变化和革命。
清华大学大数据处理中心的林辉主任在数据科学理论方面进行了初步探索,创新性地将大数据的生产要素特质进行了深化,并提出了数据的基因特质。数据生产要素化必将撼动原有的生产要素配置,促进其重组、转化和优化,带动技术和产业革命。而数据的基因特质则决定了多元数据的交叉、融合、裂变和进化,会产生意想不到的创新和发展模式。在本书中,我们不仅梳理了大数据的理论及创新指导方法论,全面地介绍了大数据相关的基础架构支撑、采集、存储、分析和处理、展示及交互等技术类别和开源实现,还深入分析了大数据在中国信息化建设、产业革命、智慧城市、三网融合等各方面的应用模式及实施路径,同时结合全球互联网及传统产业巨头的大数据应用,以及清华大学大数据处理中心在行业大数据的探索和实践,对大数据案例进行了综合分析。大数据的蓬勃发展是我国信息化发展建设过程中的一次不可多得的机遇,本书只是在大数据理论和实践上的一个粗浅尝试,我们也欢迎大家能和我们一起交流探讨,一起促进我国的云计算及大数据产业的发展,摆脱国外技术的垄断和绑架,促进民族自主技术和产品的发展。
我很感谢一起参与本书编写的专家学者,有来自微软的沈寓实、李雨航,百度的沈抖,哈佛大学的郭健,金亚科技的袁海波,为我们提供了包括云体系、安全、广告、数据挖掘、智能电视等多方面的专业知识和见解,正是你们的奉献、支持和鼓励才让这本书得以完工。我也要特别感谢清华大学大数据处理中心的同仁们,以及电子科技大学极限网络计算与服务实验室的老师和同学们,你们为本书做了大量的工程实践和资料收集整理工作,特别是肖宇、赵虎、赵志刚、李有福、王贤斌、李小龙、连路朋、刘春雷、陈尧等,谢谢你们的辛苦工作。我要尤其感谢我的妻子昆和我的女儿Sophie,你们是我努力前行的原动力。
由于我们对于大数据的理解以及知识水平都有局限,书中错误或疏漏之处在所难免,敬请读者谅解,如有问题或建议请发邮件service@tsinghuabigdata.com联系我们,谢谢读者的支持。
赵 勇
2014年6月9日于成都
|
|