新書推薦:
《
生成式人工智能:AIGC与多模态技术应用实践指南
》
售價:NT$
495.0
《
石油帝国的兴衰:英国的工业化与去工业化
》
售價:NT$
445.0
《
古典的回響:溪客舊廬藏明清文人繪畫
》
售價:NT$
1990.0
《
根源、制度和秩序:从老子到黄老学(王中江著作系列)
》
售價:NT$
550.0
《
索恩丛书·北宋政治与保守主义:司马光的从政与思想(1019~1086)
》
售價:NT$
345.0
《
掌故家的心事
》
售價:NT$
390.0
《
农为邦本——农业历史与传统中国
》
售價:NT$
340.0
《
郊庙之外:隋唐国家祭祀与宗教 增订版 (三联·哈佛燕京学术丛书)
》
售價:NT$
480.0
|
編輯推薦: |
本书全面介绍贝叶斯推理与机器学习,涉及基本概念、理论推导和直观解释,涵盖各种实用的机器学习算法,包括朴素贝叶斯、高斯模型、马尔可夫模型、线性动态系统等。本书在介绍方法的同时,强调概率层面的理论支持,可帮助读者加强对机器学习本质的认识,尤其适合想要学习机器学习中的概率方法的读者。
|
內容簡介: |
本书全面介绍贝叶斯推理与机器学习,涉及基本概念、理论推导和直观解释,涵盖各种实用的机器学习算法,包括朴素贝叶斯、高斯模型、马尔可夫模型、线性动态系统等。本书在介绍方法的同时,强调概率层面的理论支持,可帮助读者加强对机器学习本质的认识,尤其适合想要学习机器学习中的概率方法的读者。本书首先介绍概率论和图的基础概念,然后以图模型为切入点,用一种统一的框架讲解从基本推断到高阶算法的知识。本书不仅配有BRML工具箱,而且提供大量MATLAB代码实例,将概率模型与编程实践相结合,从而帮助读者更好地理解模型方法。
|
關於作者: |
作者简介:
大卫·巴伯 (David Barber) 伦敦大学学院计算机系教授,研究兴趣是概率建模和推理及其应用。他目前担任伦敦大学学院人工智能中心主管,该中心旨在开发下一代人工智能技术。此外,他还是艾伦·图灵研究所的研究员,创业公司Re:infer的首席科技官,Humanloop的联合创始人,UiPath的杰出软件工程师。他拥有剑桥大学数学学士学位,爱丁堡大学理论物理学博士学位。
译者简介:
徐增林 哈尔滨工业大学(深圳)计算机科学与技术学院教授、博士生导师,国家青年特聘专家。主要研究兴趣为机器学习及其在社交网络分析、计算机视觉、自然语言处理、健康信息学、网络空间安全等方面的应用。在包括NIPS、ICML、IJCAI、AAAI、IEEE TPAMI、IEEE TNNLS在内的著名会议和期刊上发表论文100多篇,担任JMLR、IEEE TPAMI等机器学习和人工智能领域主要期刊的审稿人。
|
目錄:
|
译者序
前言
符号表
BRML工具箱第一部分 概率模型中的推断第1章 概率推理3 1.1 概率知识复习3
1.1.1 条件概率5
1.1.2 概率表7
1.2 概率推理8
1.3 先验、似然与后验14
1.3.1 两枚骰子:各自的分数是
多少15
1.4 总结18
1.5 代码18
1.5.1 基础概率代码18
1.5.2 通用工具20
1.5.3 示例20
1.6 练习题20第2章 图的基础概念23 2.1 图23
2.2 图的数值表示25
2.2.1 边表25
2.2.2 邻接矩阵25
2.2.3 团矩阵26
2.3 总结26
2.4 代码26
2.4.1 实用程序26
2.5 练习题27第3章 信念网络29 3.1 结构化的优势29
3.1.1 独立性建模29
3.1.2 降低说明的负担32
3.2 不确定性和不可靠的证据33
3.2.1 不确定性证据33
3.2.2 不可靠证据35
3.3 信念网络36
3.3.1 条件独立性37
3.3.2 对撞的影响38
3.3.3 图路径独立性操作41
3.3.4 d-分离41
3.3.5 图和分布的独立性与
相关性42
3.3.6 信念网络中的马尔可夫
等价性43
3.3.7 信念网络的有限表达性43
3.4 因果关系44
3.4.1 辛普森悖论45
3.4.2 do算子46
3.4.3 影响图和do算子47
3.5 总结47
3.6 代码47
3.6.1 简单的推断演示47
3.6.2 条件独立性演示48
3.6.3 实用程序48
3.7 练习题48第4章 图模型52 4.1 图模型简介52
4.2 马尔可夫网络52
4.2.1 马尔可夫性质54
4.2.2 马尔可夫随机场55
4.2.3 Hammersley-Clifford理论55
4.2.4 使用马尔可夫网络的条件
独立性58
4.2.5 晶格模型58
4.3 链图模型60
4.4 因子图61
4.4.1 因子图中的条件独立性62
4.5 图模型的表达能力63
4.6 总结65
4.7 代码65
4.8 练习题65第5章 树中的有效推断68 5.1 边缘推断68
5.1.1 马尔可夫链中的变量消除和
消息传递68
5.1.2 因子图上的和-积算法71
5.1.3 处理证据74
5.1.4 计算边缘似然74
5.1.5 循环问题75
5.2 其他形式的推断75
5.2.1 最大-积75
5.2.2 寻找N个最可能的状态78
5.2.3 最可能的路径和最短的
路径79
5.2.4 混合推断82
5.3 多连通图中的推断82
5.3.1 桶消元82
5.3.2 环切条件84
5.4 连续分布中的消息传递84
5.5 总结85
5.6 代码85
5.6.1 因子图示例86
5.6.2 最可能和最短路径86
5.6.3 桶消元86
5.6.4 基于高斯的消息传递86
5.7 练习题86第6章 联结树算法90 6.1 聚类变量90
6.1.1 重参数化90
6.2 团图91
6.2.1 吸收92
6.2.2 团树上的吸收顺序93
6.3 联结树93
6.3.1 运行相交性质94
6.4 为单连通分布构建联结树97
6.4.1 伦理化97
6.4.2 构建团图97
6.4.3 根据团图构建联结树97
6.4.4 为团分配势函数97
6.5 为多连通分布构建联结树98
6.5.1 三角化算法99
6.6 联结树算法及示例102
6.6.1 关于联结树算法的备注102
6.6.2 计算分布的归一化常数103
6.6.3 边缘似然103
6.6.4 联结树算法示例104
6.6.5 Shafer-Shenoy传播105
6.7 寻找最可能的状态106
6.8 重吸收:将联结树转换为有向
网络107
6.9 近似的必要性107
6.9.1 宽度有界联结树108
6.10 总结108
6.11 代码108
6.11.1 实用程序109
6.12 练习题109第7章 决策111 7.1 期望效用111
7.1.1 货币效用111
7.2 决策树112
7.3 扩展贝叶斯网络以做出决策114
7.3.1 影响图的语法114
7.4 求解影响图118
7.4.1 影响图上的消息119
7.4.2 使用联结树119
7.5 马尔可夫决策过程122
7.5.1 利用消息传递来最大化期望
效用123
7.5.2 贝尔曼方程124
7.6 时间无穷的马尔可夫决策过程… 124
7.6.1 值迭代124
7.6.2 策略迭代125
7.6.3 维度灾难126
7.7 变分推断和规划126
7.8 金融事项128
7.8.1 期权定价和期望效用128
7.8.2 二项式期权定价模型129
7.8.3 最优投资130
7.9 进一步的主题132
7.9.1 部分可观察的MDP132
7.9.2 强化学习133
7.10 总结1
|
內容試閱:
|
前 言Bayesian Reasoning and Machine Learning
数据爆炸
我们生活在一个数据丰富且数据规模日益增长的世界里。这些数据来源于科学界(生物信息学、天文学、物理学、环境监测)和商业界(客户数据库、金融交易、发动机监控、语音识别、监测和搜索)。因此,处理数据并从中提取有价值的信息是一项非常关键且越来越重要的技能。我们的社会也希望最终能够以自然的方式与计算机互动,以便计算机可以与人类“交谈”,“理解”人类所说的话并“解析”周围的视觉世界。这些是大规模的信息处理任务,是计算机科学和相关领域的重大挑战。类似地,我们需要控制日益复杂的系统,其中可能包含许多人机交互的部分,例如机器人和自主导航。要想成功掌握此类系统,需要了解其行为背后的流程。因此,处理和理解复杂系统中的大量数据是当前迫切需要关注的问题,并且在可预见的未来可能仍然如此。
机器学习
机器学习是一种数据驱动的研究方法,它能够模仿、理解和辅助人类以及其他生物的信息处理任务。在这样的目标下,出现了许多相关问题,例如如何压缩、解释和处理数据等。通常,机器学习方法不一定直接模仿人类的处理方式,而是优化这些方式,例如股票市场预测或快速信息检索。这里,概率论可以起到关键作用,因为数据的有限性和对问题的理解程度迫使我们不得不面临不确定性问题。从最广泛的意义上讲,机器学习和相关领域的目标是从智能体运行的环境中“学习一些有用的东西”。机器学习也与人工智能密切相关,而机器学习更强调使用数据来驱动和调整模型。
在机器学习和相关领域的早期阶段,一些相对孤立的研究团体也曾发现类似的(数据分析)技术。由于图模型为图和概率论的桥梁,因此本书将通过图模型提供一种统一的处理方式,方便读者理解机器学习的概念在数学和计算科学的不同分支之间的迁移。
本书读者对象
本书适用于对大学微积分和线性代数等数学知识有一定基础的读者。虽然熟悉概率论、微积分和线性代数是很有用的,但是没有正式的计算机科学或统计背景的读者也可以学习本书。本书非常适用于想要学习机器学习中的概率方法的学生,无论他们具有何种学科背景,如计算机科学、工程学、应用统计学、物理学和生物信息学等。为了与读者形成良好的互动,本书在介绍推断的基本概念时尽可能地减少对代数和微积分的引用。更多的数学技术会等到需要时再提及,所以本书总是以概念为主,数学为辅。
本书借助许多实例来描述概念和算法。本书通过附带的MATLAB工具箱进行练习和演示,读者可通过这些实验更深入地理解书中内容。本书的最终目的是使读者能够构建新颖的算法。因此,本书更强调技能学习,而不仅是作为方法的集合。这是一个非常关键的方面,因为现代应用程序通常非常专业,所以需要新颖的方法。本书通篇采用的方法是将问题描述为图模型,再将其转换为数学框架,最终用BRML工具箱中的算法进行实现。
本书主要针对没有专业数学经验的本科生。完成本书的阅读后,读者将对机器学习的技术、实用性以及概率层面的思想体系有很好的理解,并且能够很好地理解更高级别的研究内容。
本书结构
本书从图模型和推断的基本概念开始介绍。对于自学的读者,第1~5、9、10、13~17、21和23章对概率推理、建模和机器学习做了很好的介绍。第19、24、25和28章中的内容更为高阶。其余内容则为更特殊的主题。请注意,在每一章中,内容的级别都存在差异,通常在每章末尾放置更具挑战性的内容。如图1所示,本书的部分章节可以作为概率建模领域的入门课程。
图模型课程概率机器学习课程近似推断简短课程时间序列简短课程 概率建模课程第一部分:
概率模型中的推断1:概率推理2:图的基础概念3:信念网络4:图模型5:树中的有效推断6:联结树算法7:决策第二部分:
学习概率模型8:统计机器学习9:推断学习10:朴素贝叶斯11:隐变量学习12:贝叶斯模型选择第三部分:
机器学习13:机器学习的概念14:最近邻分类15:无监督的线性降维16:有监督的线性降维17:线性模型18:贝叶斯线性模型19:高斯过程20:混合模型21:潜线性模型22:潜能力模型第四部分:
动态模型23:离散状态的马尔可夫模型24:连续状态的马尔可夫模型25:转换线性动态系统26:分布式计算第五部分:
近似推断27:抽样28:确定性近似推断
图1 本书结构及对应的课程设置第一部分和第二部分的内容已成功用于图模型课程。如上所述,我主要用第三部分的内容作为概率机器学习导论课程的材料。这两门课程可以单独讲授,一种有用的方法是先教授图模型课程,再教授单独的概率机器学习课程。
第一部分的导论性内容和第五部分更高级的内容可以作为近似推断简短课程的材料。对第一部分的精确推断方法可以相对快速地进行讲解,而第五部分的材料则需要更深入的思考。
时间序列简短课程可以主要使用第四部分的内容,考虑到不熟悉概率建模方法的读者,可以将其与第一部分的内容相结合。其中一些内容,特别是第25章中的知识更为高阶,可以推迟到课程结束或在更高级的课程
|
|