新書推薦:
《
日内交易与波段交易的资金风险管理
》
售價:NT$
390.0
《
自然信息图:一目了然的万物奇观
》
售價:NT$
640.0
《
经纬度丛书·州县之民:治乱之间的小民命运
》
售價:NT$
440.0
《
女性史:古代卷(真正意义上的女性大历史)
》
售價:NT$
560.0
《
你当我好骗吗?
》
售價:NT$
550.0
《
跨代伴侣治疗
》
售價:NT$
440.0
《
精华类化妆品配方与制备手册
》
售價:NT$
990.0
《
经纬度丛书:出祁山:诸葛亮北伐得与失
》
售價:NT$
440.0
|
內容簡介: |
本书是一本从机器学习视角讲解计算机视觉的非常好的教材。全书图文并茂、语言浅显易懂,算法描述由浅入深,即使是数学背景不强的学生也能轻松理解和掌握。作者展示了如何使用训练数据来学习观察到的图像数据和我们希望预测的现实世界现象之间的联系,以及如何如何研究这些联系来从新的图像数据中作出新的推理。本书要求少的前导知识,从介绍概率和模型的基础知识开始,接着给出让学生能够实现和修改来构建有用的视觉系统的实际示例。适合作为计算机视觉和机器学习的高年级本科生或研究生的教材,书中详细的方法演示和示例对于计算机视觉领域的专业人员也非常有用。
|
關於作者: |
Simon J. D. Prince博士,伦敦大学学院计算机科学系高级讲师。他主讲的课程包括:计算机视觉、图像处理和高级数学方法。他有着计算机科学和生物学的专业背景,发表了多篇论文,涉及计算机视觉、生物测定学、心理学、生理学、医学影像、计算机图形学和人机交互。
|
目錄:
|
目录
Computer Vision:Models,Learning,and Inference
译者序
译者简介
序
前言
第1章绪论1
11本书结构2
12其他书籍4
第一部分概率
第2章概率概述6
21随机变量6
22联合概率7
23边缘化7
24条件概率8
25贝叶斯公式9
26独立性9
27期望10
讨论10
备注11
习题11
第3章常用概率分布12
31伯努利分布13
32贝塔分布13
33分类分布14
34狄利克雷分布14
35一元正态分布15
36正态逆伽马分布15
37多元正态分布16
38正态逆维希特分布16
39共轭性17
总结18
备注18
习题18
第4章拟合概率模型21
41最大似然法21
42最大后验法21
43贝叶斯方法22
44算例1:一元正态分布22
441最大似然估计22
442最大后验估计24
443贝叶斯方法26
45算例2:分类分布28
451最大似然法28
452最大后验法29
453贝叶斯方法30
总结31
备注31
习题32
第5章正态分布34
51协方差矩阵的形式34
52协方差分解35
53变量的线性变换36
54边缘分布36
55条件分布37
56正态分布的乘积38
57变量改变38
总结38
备注39
习题39
第二部分机器视觉的机器学习
第6章视觉学习和推理42
61计算机视觉问题42
62模型的种类42
621判别模型43
622生成模型43
63示例1:回归43
631判别模型44
632生成模型44
64示例2:二值分类46
641判别模型46
642生成模型46
65应该用哪种模型48
66应用49
661皮肤检测49
662背景差分50
总结51
备注51
习题52
第7章复杂数据密度建模54
71正态分类模型54
72隐变量56
73期望最大化57
74混合高斯模型58
741混合高斯边缘化59
742基于期望最大化的混合模型拟合59
75t分布63
751学生t分布边缘化64
752拟合t分布的期望最大化65
76因子分析67
761因子分析的边缘分布68
762因子分析学习的期望最大化68
77组合模型71
78期望最大化算法的细节71
781期望最大化算法的下界73
782E步74
783M步74
79应用75
791人脸检测75
792目标识别76
793分割77
794正脸识别78
795改变人脸姿态(回归)78
796作为隐变量的变换79
总结80
备注80
习题81
第8章回归模型82
81线性回归82
811学习83
812线性回归模型的问题83
82贝叶斯线性回归84
821实际考虑85
822拟合方差86
83非线性回归87
831最大似然法87
832贝叶斯非线性回归89
84核与核技巧89
85高斯过程回归90
86稀疏线性回归91
87二元线性回归93
88相关向量回归95
89多变量数据回归96
810应用96
8101人体姿势估计96
8102位移专家97
讨论98
备注98
习题98
第9章分类模型100
91逻辑回归100
911学习:最大似然估计102
912逻辑回归模型的问题103
92贝叶斯逻辑回归104
921学习104
922推理106
93非线性逻辑回归107
94对偶逻辑回归模型108
95核逻辑回归110
96相关向量分类111
97增量拟合和boosting113
98分类树116
99多分类逻辑回归117
910随机树、随机森林和随机蕨分类器118
911与非概率模型的联系119
912应用120
9121性别分类120
9122脸部和行人检测121
9123语义分割122
9124恢复表面布局123
9125人体部位识别124
讨论125
备注125
习题127
第三部分连接局部模型
第10章图模型130
101条件独立性130
102有向图模型131
1021示例1132
1022示例2132
1023示例3133
1024总结134
103无向图模型134
1031示例1135
1032示例2136
104有向图模型与无向图模型的对比136
105计算机视觉中的图模型137
106含有多个未知量的模型推理139
1061求最大后验概率的解139
1062求后验概率分布的边缘分布139
1063最大化边缘140
1064后验分布的采样140
107样本采样140
1071有向图模型的采样141
1072无向图模型的采样141
108学习142
1081有向图模型的学习142
1082无向图模型的学习143
讨论145
备注145
习题145
第11章链式模型和树模型147
111链式模型148
1111有向链式模型148
1112无向链式模型148
1113模型的等价性148
1114隐马尔可夫模型在手语中的应用149
112链式MAP推理149
113树的MAP推理152
114链式边缘后验推理155
1141求解边缘分布155
1142前向后向算法156
1143置信传播157
1144链式模型的和积算法158
115树的边缘后验推理160
116链式模型和树模型的学习161
117链式模型和树模型之外的东西161
118应用163
1181手势跟踪163
1182立体视觉164
1183形象化结构166
1184分割167
讨论167
备注168
习题169
第12章网格模型172
121马尔可夫随机场172
1211网格示例173
1212离散成对MRF图像去噪174
122二值成对马尔可夫随机场的MAP推理175
1221最大流最小割176
1222MAP推理:二值变量177
123多标签成对MRF的MAP推理182
124非凸势的多标签MRF186
125条件随机场189
126高阶模型190
127网格有向模型190
128应用191
1281背景差分191
1282交互式分割192
1283立体视觉193
1284图像重排193
1285超分辨率195
1286纹理合成196
1287合成新面孔197
讨论198
备注198
习题200
第四部分预处理
第13章图像预处理与特征提取204
131逐像素变换204
1311白化204
1312直方图均衡化205
1313线性滤波206
1314局部二值模式210
1315纹理基元映射211
132边缘、角点和兴趣点212
1321Canny边缘检测器212
1322Harris角点检测器214
1323SIFT检测器215
133描述子216
1331直方图216
1332SIFT描述子216
1333方向梯度直方图217
1334词袋描述子218
1335形状内容描述子218
134降维219
1341单数值近似220
1342主成分分析221
1343二元主成分分析221
1344K均值算法222
结论223
备注223
习题224
第五部分几何模型
第14章针孔摄像机228
141针孔摄像机简介228
1411归一化摄像机229
1412焦距参数230
1413偏移量和偏移参数230
1414摄像机的位置与方向231
1415全针孔摄像机模型232
1416径向畸变232
142三个几何问题233
1421问题1:学习外在参数233
1422问题2:学习内在参数234
1423问题3:推理3D世界点235
1424解决问题235
143齐次坐标236
144学习外在参数237
145学习内在参数239
146推理3D世界点240
147应用241
1471结构光的深度241
1472剪影重构243
讨论245
备注245
习题246
第15章变换模型249
151二维变换模型249
1511欧氏变换模型249
1512相似变换模型251
1513仿射变换模型252
1514投影变换模型252
1515增加不确定性254
152变换模型中的学习255
1521学习欧氏参数255
1522学习相似参数256
1523学习仿射参数256
1524学习投影参数257
153变换模型中的推理258
154平面的三个几何问题258
1541问题1:学习外在参数258
1542问题2:学习内在参数260
1543问题3:与摄像机相关的3D位置推理261
155图像间的变换261
1551单应性的几何特征262
1552计算图像间的变换263
156变换的鲁棒学习264
1561RANSAC264
1562连续RANSAC265
1563PEaRL266
157应用268
1571增强现实追踪268
1572视觉全景269
讨论270
备注270
习题271
第16章多摄像机系统273
161双视图几何学理论273
1611极线约束274
1612极点274
162实矩阵275
1621实矩阵的属性276
1622实矩阵的分解277
163基础矩阵279
1631基础矩阵的估计279
16328点算法280
164双视图重构的流程281
165校正284
1651平面校正284
1652极面校正286
1653校正后处理287
166多视图重构287
167应用290
1671三维重构290
1672图片浏览291
1673立体图割292
讨论293
备注293
习题294
第六部分视觉模型
第17章形状模型298
171形状及其表示298
172snake模型299
1721推理301
1722snake模型中存在的问题301
173形状模板302
1731推理303
1732用迭代最近点算法进行推理304
174统计形状模型304
1741学习305
1742推理306
175子空间形状模型306
1751概率主成分分析307
1752学习308
1753推理309
176三维形状模型311
177形状和外观的统计模型311
1771学习313
1772推理314
178非高斯统计形状模型315
1781回归PPCA315
1782高斯过程隐变量模型316
179铰接式模型317
1710应用319
17101三维形变模型319
17102三维人体模型321
讨论322
备注322
习题324
第18章身份与方式模型326
181子空间身份模型328
1811学习329
1812推理331
1813在其他识别任务中的推理332
1814身份子空间模型的局限性333
182概率线性判别分析334
1821学习335
1822推理335
183非线性身份模型336
184非对称双线性模型337
1841学习339
1842推理339
185对称双线性和多线性模型341
1851学习342
1852推理343
1853多线性模型344
186应用344
1861人脸识别344
1862纹理建模345
1863动画合成346
讨论346
备注346
习题348
第19章时序模型349
191时序估计框架349
1911推理350
1912学习350
192卡尔曼滤波器351
1921推理351
1922改写测量合并阶段352
1923推理总结353
1924示例1353
1925示例2354
1926滤波355
1927时序和测量模型356
1928卡尔曼滤波器的问题358
193扩展卡尔曼滤波器358
194无损卡尔曼滤波器360
1941状态演化361
1942测量合并过程362
195粒
|
內容試閱:
|
前言Computer Vision:Models,Learning,and Inference目前,已有很多关于计算机视觉的书籍,那么还有必要再写另外一本吗?下面解释撰写本书的原因。
计算机视觉是一门工程学科,机器在现实世界中捕获的视觉信息可以激发我们的积极性。因此,我们通过使用计算机视觉解决现实问题来对我们的知识进行分类。例如,大多数视觉教科书都包含目标识别和立体视觉内容。我们的学术研讨会也是用同样的模式进行组织的。本书对这一传统方式提出了质疑:这真的是我们组织自己知识的正确方法吗?对于目标识别问题,目前已提出多种算法解决这一问题(例如子空间模型、boosting模型、语义包模型、星座模型等)然而,这些方法没有什么共同点。任何试图全面描述知识的壮举都会转变为一个非结构化的技术列表。我们怎样让新同学把所有的技术和理论都弄懂呢?我主张使用一种不同的方式来组织知识,但首先让我告诉大家我是如何看待计算机视觉问题的。
对于一幅图像,我们不仅要观察图像中的内容,同时还需要提取其测量值。例如,我们可以直接使用RGB值,或者对图像进行滤波处理,或者执行一些更复杂的预处理。计算机视觉的目标或者需要解决的问题是使用这些测量值来推理全局状态。例如:在立体视觉中,我们尝试推断出场景的深度。在目标识别中,我们尝试推断某一特定类目标存在与否。
为了实现目标,我们建立一个模型。模型描述了测量值与全局状态之间的一系列统计关系。这一系列统计关系中的特殊成员是由一个参数集合确定的。在学习的过程中,选择这些参数,以便它们能够准确反映测量值与全局状态之间的关系。在推理的过程中,选用一组新的测量值,并利用学习后的模型来推理全局状态。学习和推理的方法包含在算法中。我认为计算机视觉应该从以下几方面来理解:目标、测量值、全局状态、模型、参数、学习和推理算法。
我们可以根据这些量选择性地组织知识,但在我看来,模型中最重要的内容是全局状态和测量值之间的统计关系。这主要有三个原因。首先,模型的类型往往超越了应用同一个模型可用于不同的视觉任务;其次,模型能够自然地把它们自身组织成一些可分开理解的系列(例如,回归、马尔可夫随机场、相机模型);最后,在模型层次上讨论视觉问题使得我们能够得到那些貌似不相关的算法和应用之间的关联。因此,本书的章节安排非常巧妙,每个主要的章节都讨论一系列不同的模型。
最后一点,本书中的大部分思想在第一次接触到时是难以理解的。因此,我的目标是使后续研究计算机视觉的学生更容易理解这些内容,我希望这本书能够达到这一目的,并能够激励读者深入了解计算机视觉。
原出版社网站和作者网站(www.computervisionmodels.com)上包含丰富的教辅和参考资源,包括教学幻灯片、插图文件、书中包含算法和模型的详细介绍、源代码、进一步阅读资源、相关课程的教学大纲以及部分习题答案。书中全部习题答案,只有使用本书作为教材的教师才可以申请,需要的教师可向剑桥大学出版社北京代表处申请,电子邮件:solutions@cambridgeorg。——编辑注致谢非常感谢以下阅读本书并提出宝贵意见的读者:Yun Fu、David Fleet、Alan Jepson、Marc’Aurelio Ranzato、Gabriel Brostow、Oisin Mac Aodha、Xiwen Chen、PoHsiu Lin、Jose Tejero Alonso、Amir Sani、Oswald Aldrian、Sara Vicente、Jozef Dobos、Andrew Fitzgibbon、Michael Firman、Gemma Morgan、Daniyar Turmukhambetov、Daniel Alexander、Mihaela Lapusneanu、JohnWinn、Petri Hiltunen、Jania Aghajanian、Alireza Bossaghzadeh、Mikhail Sizintsev、Roger De SouzaEremita、Jacques Cali、Roderick de Nijs、James Tompkin、Jonathan O’Keefe、Benedict Kuester、Tom Hart、Marc Kerstein、Alex Borés、Marius Cobzarenco、Luke Dodd、Ankur Agarwal、Ahmad Humayun、Andrew Glennerster、Steven Leigh、Matteo Munaro、Peter van Beek、Hu Feng、Martin Parsley、Jordi Salvador Marcos、Josephine Sullivan、Steve Thompson、Laura Panagiotaki、Damien Teney、Malcolm Reynolds、Francisco Estrada、Peter Hall、James Elder、Paria Mehrani、Vida Movahedi、Eduardo Corral Soto、Ron Tal、Bob Hou、Simon Arridge、Norberto Goussies、Steve Walker、Tracy Petrie、Kostantinos Derpanis、Bernard Buxton、Matthew Pediaditis、Fernando FloresMangas、Jan Kautz、Alastair Moore、Yotam Doron、Tahir Majeed、David Barber、Pedro Quelhas、Wenchao Zhang、Alan Angold、Andrew Davison、Alex Yakubovich、Fatemeh Jamali、David Lowe、Ricardo David、Jamie Shotton、Andrew Zisserman、Sanchit Singh、Vincent Lepetit、David Liu、Marc Pollefeys、Christos Panagiotou、Ying Li、Shoaib Ehsan、Olga Veksler、Modesto Castrillón Santana、Axel Pinz、Matteo Zanotto、Gwynfor Jones、Brian Jensen、Mischa Schirris、Jacek Zienkiewicz、Etienne Beauchesne、Erik Sudderth、Giovanni Saponaro、Moos Hueting
|
|