新書推薦:
《
中平:东汉王朝大崩溃(184—189)
》
售價:NT$
245.0
《
基于鲲鹏的分布式图分析算法实战
》
售價:NT$
495.0
《
中国历史研究入门(全二册)
》
售價:NT$
1290.0
《
夺回大脑 如何靠自己走出强迫
》
售價:NT$
299.0
《
夏天,19岁的肖像(青鲤文库)岛田庄司两次入围日本通俗文学奖直木奖的作品 ,同名电影由黄子韬主演!
》
售價:NT$
225.0
《
图解机械工程入门
》
售價:NT$
440.0
《
股市长线法宝(第6版)
》
售價:NT$
640.0
《
中文版SOLIDWORKS 2024机械设计从入门到精通(实战案例版)
》
售價:NT$
450.0
|
內容簡介: |
本书是深度学习的入门教材,系统地介绍了深度学习的基本概念与实战应用,包括深度学习在图像、语音、文本方向的应用,以及前沿发展等。本书分为10章,大致为3个部分:第1部分(1-3章)介绍深度学习的基础知识。第2部分(4-6章)介绍深度学习的各个方面,从算法设计到模型实现。第3部分(8-10章)介绍深度学习的实战应用以及前沿发展。每章都附有相应的习题和参考文献,以便感兴趣的读者进一步深入思考。"让学习变得轻松是本书的基本编写理念。本书适合作为相关专业本科和研究生教材,也适合作为深度学习研究与开发人员的入门书籍。
|
關於作者: |
清华大学博士,解放军理工大学教授、学科带头人,中国云计算专家委员会委员。主要研究方向为信息网格和云计算,完成科研课题18项,发表论文70余篇,获部级科技进步奖6项。曾夺得国际计算机排序比赛冠军,并二次夺得全国高校科技比赛*高奖,获全军十大学习成才标兵、南京十大杰出青年和清华大学学术新秀等称号。2002年首倡的网格计算池和2003年研发的反垃圾邮件网格分别为云计算和云安全的前身。创办了知名的中国网格和中国云计算网站。
|
目錄:
|
第1章深度学习的来源与应用1
1.1人工智能的思想、流派与发展起落1
1.1.1人工智能的思潮流派和主要研究与应用领域2
1.1.2人工智能的三起三落4
1.2什么是深度学习6
1.2.1我们不分离数据和算法6
1.2.2深度学习基础9
1.3机器学习与深度学习10
1.3.1机器学习的定义与种类10
1.3.2机器学习的任务与方法13
1.3.3深度学习的提出16
1.4深度学习的应用场景18
1.4.1应用场合和概念层次18
1.4.2主要开发工具和框架20
1.4.3人工智能、深度学习有关学术会议和赛事22
习题24
参考文献24
第2章深度学习的数学基础26
2.1线性代数26
2.1.1向量空间26
2.1.2矩阵分析28
2.2概率与统计30
2.2.1概率与条件概率30
2.2.2贝叶斯理论33
2.2.3信息论基础35
2.3多元微积分39
2.3.1导数和偏导数39
2.3.2梯度和海森矩阵42
2.3.3最速下降法44
2.3.4随机梯度下降算法45
习题48
参考文献50
第3章人工神经网络与深度学习51
3.1探秘大脑的工作原理52
3.1.1人类活动抽象与深度学习模型53
3.1.2人脑神经元的结构54
3.1.3人脑神经元功能55
3.1.4人脑视觉机理57
3.2人脑神经元模型59
3.2.1人脑神经元模型介绍60
3.2.2激活函数62
3.3M-P模型64
3.3.1标准M-P模型65
3.3.2改进的M-P模型66
3.4人脑神经网络的互连结构66
3.4.1前馈神经网络67
3.4.2反馈网络67
3.5人工神经网络的学习68
3.5.1人工神经网络的学习方式68
3.5.2神经网络的学习规则71
3.5.3人工神经网络算法基本要求73
3.5.4神经网络计算特点74
3.6人工神经网络的特点75
3.7神经网络基本概念与功能76
3.7.1几个基本概念76
3.7.2基本功能78
3.7.3感知机的局限性83
3.8深度学习其他网络结构84
3.8.1卷积神经网络88
3.8.2循环(递归)神经网络94
习题97
参考文献98
第4章深度学习基本过程99
4.1正向学习过程99
4.1.1正向学习概述99
4.1.2正向传播的流程100
4.1.3正向传播的详细原理100
4.2反向调整过程102
4.2.1反向调整概述102
4.2.2反向传播过程详解103
4.2.3深层模型反向调整的问题与对策106
4.3手写体数字识别实例107
4.3.1数据准备107
4.3.2网络设计109
4.3.3模型训练115
4.3.4模型测试116
习题121
参考文献121
第5章深度学习主流模型122
5.1卷积神经网络123
5.1.1CNN概念123
5.1.2CNN常用算法127
5.1.3CNN训练技巧131
5.2循环神经网络132
5.2.1RNN结构132
5.2.2RNN训练133
5.2.3RNN训练技巧135
习题136
参考文献136
第6章深度学习的主流开源框架138
6.1Caffe138
6.1.1Caffe框架138
6.1.2安装Caffe139
6.1.3案例:基于Caffe的目标识别145
6.2TensorFlow146
6.2.1TensorFlow框架146
6.2.2安装TensorFlow147
6.2.3案例:基于TensorFlow的目标识别149
6.3其他开源框架150
6.3.1CNTK150
6.3.2MXNet151
6.3.3Theano151
6.3.4Torch151
6.3.5Deeplearning4j152
习题153
参考文献153
第7章深度学习在图像中的应用154
7.1图像识别基础154
7.2基于深度学习的大规模图像识别155
7.2.1大规模图像数据库:ImageNet155
7.2.2AlexNet网络结构156
7.2.3非线性激活函数ReLU157
7.2.4在多GPU上进行实现158
7.2.5增加训练样本158
7.2.6dropout技术159
7.3应用举例:人脸识别160
7.3.1人脸识别的经典流程160
7.3.2人脸图像数据库161
7.3.3基于深度学习的人脸识别方法162
7.4应用举例:图像风格化163
7.4.1内容重构164
7.4.2风格重构165
7.4.3内容与风格的重组166
7.5应用举例:图像标注167
7.5.1基于深度网络的图像标注方法概述168
7.5.2视觉语义对齐169
7.5.3为新图像生成对应文本描述171
习题172
参考文献172
第8章深度学习在语音中的应用174
8.1语音识别基础174
8.1.1人类之间的交流175
8.1.2人机交流175
8.1.3语音识别系统的基本结构176
8.1.4特征提取176
8.1.5声学模型177
8.1.6语言模型177
8.1.7解码器178
8.1.8用于语音识别的GMM-HMM模型178
8.2基于深度学习的连续语音识别181
8.2.1DNN-HMM混合系统181
8.2.2CD-DNN-HMM的关键模块及分析185
8.3应用举例:语音输入法190
8.3.1案例背景190
8.3.2语音输入法设计191
8.3.3语音中心SpeechCenter的设计192
8.3.4输入法FreeVoice的设计194
8.3.5FreeVoice和SpeechCenter之间的通信设计196
习题198
参考文献198
第9章深度学习在文本中的应用201
9.1自然语言处理基础201
9.1.1正则表达式和自动机202
9.1.2句法处理203
9.1.3词的分类和词性标注203
9.1.4上下文无关语法205
9.1.5浅层语法分析205
9.1.6语义分析206
9.1.7语义网络206
9.1.8词汇关系信息库206
9.2基于深度学习的文本处理207
9.2.1词汇向量化表示207
9.2.2句法分析209
9.2.3神经机器翻译209
9.2.4情感分析210
9.3应用举例:机器翻译211
9.4应用举例:聊天机器人215
9.4.1 聊天机器人的主要功能模块216
9.4.2 主要的技术挑战217
9.4.3 深度学习构建智能聊天机器人218
习题220
参考文献220
第10章深度学习前沿发展222
10.1增强学习222
10.1.1增强学习的基本概念222
10.1.2增强学习的过程224
10.1.3增强学习的应用225
10.2迁移学习225
10.2.1迁移学习的定义226
10.2.2迁移学习的分类226
10.2.3迁移学习的应用场景226
10.3记忆网络228
10.3.1循环神经网络228
10.3.2长短期记忆网络228
10.3.3长短期记忆变体231
10.4深度学习的硬件实现232
10.4.1FPGA232
10.4.2ASIC233
10.4.3TPU234
10.4.4寒武纪235
10.4.5TrueNorth237
习题238
参考文献238
附录A人工智能和大数据实验环境240
|
內容試閱:
|
总序
短短几年间,大数据就以一日千里的发展速度,快速实现了从概念到落地,直接带动了相关产业井喷式发展。全球多家研究机构统计数据显示,大数据产业将迎来发展黄金期:IDC预计,大数据和分析市场将从2016年的1300亿美元增长到2020年的2030亿美元以上;中国报告大厅发布的大数据行业报告数据也说明,自2017年起,我国大数据产业将迎来发展黄金期,未来2~3年的市场规模增长率将保持在35%左右。
数据采集、数据存储、数据挖掘、数据分析等大数据技术在越来越多的行业中得到应用,随之而来的就是大数据人才问题的凸显。麦肯锡预测,每年数据科学专业的应届毕业生将增加7%,然而仅高质量项目对于专业数据科学家的需求每年就会增加12%,完全供不应求。根据《人民日报》的报道,未来3~5年,中国需要180万数据人才,但目前只有约30万人,人才缺口达到150万之多。
以贵州大学为例,其首届大数据专业研究生就业率就达到100%,可以说一抢而空。急切的人才需求直接催热了大数据专业,国家教育部正式设立数据科学与大数据技术本科新专业。目前已经有两批共计35所大学获批,包括北京大学、中南大学、对外经济贸易大学、中国人民大学、北京邮电大学、复旦大学等。估计2018年会有几百所高校获批。
不过,就目前而言,在大数据人才培养和大数据课程建设方面,大部分高校仍然处于起步阶段,需要探索的还有很多。首先,大数据是个新生事物,懂大数据的老师少之又少,院校缺人;其次,尚未形成完善的大数据人才培养和课程体系,院校缺机制;再次,大数据实验需要为每位学生提供集群计算机,院校缺机器;最后,院校没有海量数据,开展大数据教学科研工作缺原材料。
其实,早在网格计算和云计算兴起时,我国科技工作者就曾遇到过类似的挑战,我有幸参与了这些问题的解决过程。为了解决网格计算问题,我在清华大学读博期间,于2001年创办了中国网格信息中转站网站,每天花几个小时收集和分享有价值的资料给学术界,此后我也多次筹办和主持全国性的网格计算学术会议,进行信息传递与知识分享。2002年,我与其他专家合作的《网格计算》教材也正式面世。
2008年,当云计算开始萌芽之时,我创办了中国云计算网站(chinacloud.cn)(在各大搜索引擎云计算关键词中排名第一),2010年出版了《云计算(第一版)》、2011年出版了《云计算(第二版)》、2015年出版了《云计算(第三版)》,每一版都花费了大量成本制作并免费分享对应的几十个教学PPT。目前,这些PPT的下载总量达到了几百万次之多。同时,《云计算》教材也成为国内高校的首选教材,在CNKI公布的高被引图书名单中,对于2010年以来出版的所有图书,《云计算第一版》在自动化和计算机领域排名全国第一。除了资料分享,在2010年,我在南京组织了全国高校云计算师资培训班,培养了国内第一批云计算老师,并通过与华为、中兴、360等知名企业合作,输出云计算技术,培养云计算研发人才。这些工作获得了大家的认可与好评,此后我接连担任了工信部云计算研究中心专家、中国云计算专家委员会云存储组组长等职位。
近几年,面对日益突出的大数据发展难题,我也正在尝试使用此前类似的办法去应对这些挑战。为了解决大数据技术资料缺乏和交流不够通透的问题,我于2013年创办了中国大数据网站(thebigdata.cn),投入大量的人力进行日常维护,该网站目前已经在各大搜索引擎的大数据关键词排名中位居第一;为了解决大数据师资匮乏的问题,我面向全国院校陆续举办多期大数据师资培训班。2016年年末至今,在南京多次举办全国高校高职中职大数据免费培训班,基于《大数据》《大数据实验手册》以及云创大数据提供的大数据实验平台,帮助到场老师们跑通了Hadoop、Spark等多个大数据实验,使他们跨过了从理论到实践,从知道到用过的门槛。2017年5月,还举办了全国千所高校大数据师资免费讲习班,盛况空前。
其中,为了解决大数据实验难的问题而开发的大数据实验平台,正在为越来越多高校的教学科研带去方便:2016年,我带领云创大数据(www.cstor.cn,股票代码:835305)的科研人员,应用Docker容器技术,成功开发了BDRack大数据实验一体机,它打破虚拟化技术的性能瓶颈,可以为每一位参加实验的人员虚拟出Hadoop集群、Spark集群、Storm集群等,自带实验所需数据,并准备了详细的实验手册(包含42个大数据实验)、PPT和实验过程视频,可以开展大数据管理、大数据挖掘等各类实验,并可进行精确营销、信用分析等多种实战演练。目前,大数据实验平台已经在郑州大学、西京学院、郑州升达经贸管理学院、镇江高等职业技术学校等多所院校成功应用,并广受校方好评。该平台也以云服务的方式在线提供(大数据实验平台,https:bd.cstor.cn),帮助师生通过自学,用一个月左右的时间成为大数据动手的高手。
同时,为了解决缺乏权威大数据教材的问题,我所负责的南京大数据研究院,联合金陵科技学院、河南大学、云创大数据、中国地震局等多家单位,历时两年,编著出版了适合本科教学的《大数据》《大数据库》《大数据实验手册》等教材。另外,《数据挖掘》《虚拟化与容器》《大数据可视化》《深度学习》等本科教材也将于近期出版。在大数据教学中,本科院校的实践教学应更加系统性,偏向新技术的应用,且对工程实践能力要求更高。而高职、高专院校则更偏向于技术性和技能训练,理论以够用为主,学生将主要从事数据清洗和运维方面的工作。基于此,我们还联合多家高职院校专家准备了《云计算基础》《大数据基础》《数据挖掘基础》《R语言》《数据清洗》《大数据系统运维》《大数据实践》系列教材,目前也已经陆续进入定稿出版阶段。
此外,我们也将继续在中国大数据(thebigdata.cn)和中国云计算(chinacloud.cn)等网站免费提供配套PPT和其他资料。同时,持续开放大数据实验平台(https:bd.cstor.cn)、免费的物联网大数据托管平台万物云(wanwuyun.com)和环境大数据免费分享平台环境云(envicloud.cn),使资源与数据随手可得,让大数据学习变得更加轻松。
在此,特别感谢我的硕士导师谢希仁教授和博士导师李三立院士。谢希仁教授所著的《计算机网络》已经更新到第7版,与时俱进且日臻完美,时时提醒学生要以这样的标准来写书。李三立院士是留苏博士,为我国计算机事业做出了杰出贡献,曾任国家攀登计划项目首席科学家。他严谨治学的态度带出了一大批杰出的学生。
本丛书是集体智慧的结晶,在此谨向付出辛勤劳动的各位作者致敬!书中难免会有不当之处,请读者不吝赐教。我的邮箱:gloud@126.com,微信公众号:刘鹏看未来(lpoutlook)。
刘鹏
于南京大数据研究院
前言
自2012年以来,深度学习在图像识别上取得了重大突破,使得深度学习技术得到了前所未有的关注。越来越多的科研人员与工程技术人员投入到深度学习的研究中,涌现出了大量的深度学习开源框架和成功应用,各种基于深度学习的技术和应用也层出不穷。有关深度学习的文章、评论、文档也非常多。然而尚缺乏针对本科生入门的系统性深度学习教材,以使读者可以了解深度学习的来龙去脉,为以后进一步使用深度学习做相关应用或者深入研究深度学习技术奠定基础。
南京大数据研究院刘鹏教授顺势而为,周密思考,在高级大数据人才培养课程体系中,专门设立深度学习课程,并邀请全国上百家高校中从事一线教学科研任务的教师一起,编撰高级大数据人才培养丛书。本书即该套丛书之一。
本书的定位是深度学习。以让学习变得轻松为根本出发点,介绍深度学习的入门知识,通过浅显易懂的语言,将深度学习的发展过程说清楚,以便将来对深度学习进行进一步深入研究或应用。本书特别注重动手能力,因此对于书中所有的例子和实验,都可以使用深度学习一体机进行练习。读者在读完本书之后,不仅仅了解了深度学习的原理,更重要的是,可以自己搭建深度学习的环境,训练自己的深度学习模型,甚至构建深度学习的原型系统。
本书以教育部十三五规划和学校的相关规划发展为依据,响应国家有关大力发展人工智能的号召,遵循本科教育的规律,顺应学生身心发展的特点,致力于构建开放而有力的教材体系,促进学生学习方式的改变,全面提高学生的知识素养,为他们的终身学习、生活和工作奠定坚实的理论和实践基础。作为深度学习的入门教材,本书分别从基本概念、基础与应用(包括深度学习在图像、语音、文本方向的应用),以及前沿发展等方面系统介绍了深度学习。本书大致分3个部分:第1部分介绍深度学习的基础知识。第2部分介绍深度学习模型与算法。第3部分介绍深度学习的应用,最后附上人工智能和大数据实验环境的介绍供读者参考。
本书得到了南京大数据研究院院长刘鹏教授,金陵科技学院副校长张燕教授的大力支持。2015年度江苏高校优秀科技创新团队大数据智能挖掘信息技术研究在书稿提纲和内容组织上提出了诸多建设性意见。编写过程得到了金陵科技学院高层次人才科研启动基金(40610186)、国家自然科学基金(61472005)、江苏高校软件工程品牌专业建设工程(PPZY2015B140)的资助。同时,南京大学吴建鑫教授和南京信息工程大学袁晓彤教授评阅了本书的稿件,对本书给予了全面指导和帮助。在此一并致谢。
当前,深度学习技术处在高速的发展阶段,其概念内涵、技术方法、应用模式都在不断演化之中。由于时间和水平所限,本书还存在缺点和不足,欢迎读者不吝赐教,批评指正。
编 者
2017年10月
|
|