新書推薦:
《
艺术家之路 塑造插画风格
》
售價:NT$
759.0
《
古乐钩沉(中国音乐学院60周年校庆中青年学者文集)
》
售價:NT$
602.0
《
我和抑郁症的3000天
》
售價:NT$
301.0
《
与骸骨交谈:我希望每一个真相都被发现
》
售價:NT$
347.0
《
人体使用手册3:自愈力的逻辑(全面解读身体面对疾病时的反应逻辑,学习更多有效的系列家庭按摩)
》
售價:NT$
281.0
《
素描简史:从文艺复兴到现代艺术
》
售價:NT$
1989.0
《
智慧宫丛书028·神工智能 诸神与古代世界的神奇造物
》
售價:NT$
398.0
《
街头健身训练指南
》
售價:NT$
1214.0
|
編輯推薦: |
极易上手:即使你是计算机视觉的小白,本书照样带你从零起步,步入计算机视觉炫丽的殿堂
通俗易懂:用简洁明了的语言、用直观形象的例子生动讲解枯燥、晦涩、难懂的各种原理,让你学习过程中举重若轻
注重实战:每一章都配有有实战案例,代码详细注释,让读者能够在实践中应用算法
环环相扣:章与章之间逻辑紧密、环环相扣,在学习过程中没有突兀感、跳跃感
|
內容簡介: |
本书详细讲解基于OpenCV的传统计算机视觉和以TensorFlow代码为主的基于深度学习的计算机视觉。 本书从基本的图像特征开始,包括颜色特征、几何特征、局部特征、梯度特征,到图像美化,再到传统目标检测、光流与跟踪等;继而进入深度学习部分,首先带来深度学习的基本原理,然后是卷积神经网络的深入剖析,进而阐述如何将卷积神经网络应用于计算机视觉的物体分类、目标检测等常见问题上,*后介绍计算机视觉*的GAN网络。本书以非常简单的公式和原理解释学习过程中遇到的问题,通过大量精美的图片让读者直观感受计算机视觉的效果,深入理解计算机视觉的核心内容。 本书适合人工智能方向的大学本科生、研究生,以及初学者阅读。对于有一定基础和经验的读者,也能帮助他们查缺补漏,深入理解和掌握相关原理和方法,提高实际解决问题的能力。
|
關於作者: |
余海林,清华大学数理基础科学实验班毕业、美国加州大学洛杉矶分校(UCLA)计算机硕士毕业,AI火箭营高级讲师。有着扎实的数理基础和计算机编程能力,曾获得美国大学生数学建模大赛一等奖。擅长机器学习、深度学习、计算机视觉、自然语言处理等AI领域的前沿技术,参与过多个AI实践项目。在AI火箭营开设多门课程,累计学习人次超过10万,讲课风格严谨而幽默、深刻且易懂,深受广大学员的认可。
翟中华,清华大学硕士毕业,北京洪策元创智能科技有限公司CEO,AI火箭营首席讲师。在机器学习、深度学习、计算机视觉、自然语言处理等人工智能领域有扎实的理论基础和丰富的应用实践经验。主讲的课程深度学习入门系列讲解PyTorch深度学习实战等累计学员约30万人次,讲课风格抽丝剥茧、深入浅出、以简驭繁,能够把复杂的原理简单化,把简单的原理内涵化,深受广大学员的认可。
|
目錄:
|
第1章机器看世界
1.1计算机眼里的图像
1.2计算机视觉的起源
1.2.1马尔计算视觉
1.2.2主动和目的视觉
1.2.3多视几何和分层三维重建
1.2.4基于学习的视觉
1.3计算机视觉的难点
1.4深度学习的起源
1.5基于深度学习的计算机视觉
1.5.1研究方向
1.5.2未来发展
第2章传统图像处理之OpenCV的妙用
2.1OpenCV安装
2.2OpenCV模块
2.3OpenCV数据存取
2.4OpenCV图像基本操作
2.4.1OpenCV图像缩放
2.4.2OpenCV图像裁剪
2.4.3OpenCV图像旋转
2.5从摄像头读取
2.6矩阵操作
第3章传统图像处理之寻找特征
3.1颜色特征
3.1.1RGB颜色空间
3.1.2HIS颜色空间
3.1.3HSV颜色空间
3.1.4颜色直方图
3.1.5OpenCV图像色调,对比度变化
3.2几何特征
3.2.1边缘特征
3.2.2角点
3.2.3斑点
3.3局部特征
3.3.1SIFT算法
3.3.2SURF算法
3.4代码实战: 图像匹配
第4章传统图像处理之图像美化
4.1添加图形与文字
4.2图像美白
4.3图像修复与去噪
4.4图像轮廓
4.5图像金字塔
4.6代码实战: 图像融合
第5章传统图像处理之相机模型
5.1相机模型
5.1.1针孔相机模型
5.1.2射影几何
5.2透镜
5.3透镜畸变
第6章传统图像处理之目标检测
6.1OpenCV中的机器学习
6.1.1机器学习简介
6.1.2OpenCV机器学习数据流
6.1.3OpenCV机器学习算法
6.2基于支持向量机的目标检测与识别
6.2.1词袋算法
6.2.2隐式支持向量机算法
6.3基于树方法的目标检测与识别
6.4代码实战: 人脸识别
6.5传统图像总结
第7章深度学习初识
7.1深度学习基础
7.2正向传播、反向传播算法
7.3非线性激活函数
7.4Dropout正则化方法
7.5GPU加速运算
第8章基于深度学习的计算机视觉之卷积神经网络
8.1卷积神经网络基本架构
8.1.1卷积层
8.1.2池化层
8.1.3全连接层
8.1.4Softmax激活函数
8.1.5交叉熵损失
8.2AlexNet结构详解
8.3卷积神经网络的优点
第9章基于深度学习的计算机视觉之TensorFlow
9.1TensorFlow的起源
9.2TensorFlow基础知识
9.2.1安装
9.2.2图计算
9.2.3TensorFlow 2.0
9.2.4张量
9.2.5tf.data
9.2.6可视化
9.2.7模型存取
9.2.8Keras接口
9.2.9神经网络搭建
9.3代码实战: 手写数字
第10章基于深度学习的计算机视觉之目标识别
10.1目标识别的概念
10.2构建数据集的方法
10.3搭建神经网络
10.4训练及效果评估
10.5解决过拟合
10.6数据增强
10.7迁移学习
第11章基于深度学习的计算机视觉之两阶段目标检测
11.1什么是目标检测
11.2目标检测的难点
11.3目标检测的基础知识
11.3.1候选框
11.3.2交并比
11.3.3非极大值抑制
11.3.4传统目标检测基本流程
11.4目标检测效果评估
11.5二阶段算法: RCNN类网络
11.5.1RCNN网络
11.5.2Fast RCNN网络
11.5.3Faster RCNN网络
11.6代码实战
第12章基于深度学习的计算机视觉之阶段目标检测
12.1YOLO网络
12.1.1YOLO起源
12.1.2YOLO原理
12.1.3YOLOv2原理
12.1.4YOLOv3原理
12.1.5YOLO应用
12.2SSD网络
12.3代码实战: 车牌识别
第13章人脸识别: 传统方法VS深度学习
13.1人脸识别技术的历史
13.2人脸识别技术的发展前景
13.3人脸识别技术主要流程
13.3.1人脸识别的主要流程
13.3.2人脸识别的主要方法
13.3.3人脸识别的技术指标
13.4深度学习方法
13.5人脸识别的挑战
第14章基于深度学习的计算机视觉: 生成模型
14.1自动编码器
14.1.1去噪自动编码器
14.1.2变分自动编码器
14.2风格迁移
14.3GAN网络
参考文献
|
內容試閱:
|
深度学习应用于计算机视觉已经非常普遍,自从AlexNet横空出世,卷积神经网络在计算机视觉领域一骑绝尘,频频突破原先的最佳模型,甚至在多个任务上超越人类。遗憾的是,市面上关于基于深度学习计算机视觉的中文书少之又少,其中精品更是很难见到。有的书注重讲解数学,忽略了计算机视觉是一门实践科学的本质; 有的书有很多代码实战,却轻描淡写地带过了计算机视觉和深度学习的原理。对于深度学习和计算机视觉来说,原理和实践是相辅相成的,缺一不可。有的书确实做到了原理和实践相结合,但是忽略了传统计算机视觉的重要性,只关注基于深度学习的计算机视觉。于是笔者决定写一本真正的计算机视觉入门图书,既包括传统计算机视觉和深度学习,又包括原理和代码实战。
本书的写成源于AI火箭营的初心,我们希望在人工智能时代来临之际,能够帮助更多的人进入人工智能技术的殿堂,使更多的人利用人工智能解决现实中的实际问题,让更多的人在各行各业用人工智能升级改造传统产业或技术体系。
本书内容
本书从传统计算机视觉入手,通过色彩特征、局部特征、梯度特征等带领读者走入图像的世界,而后介绍传统计算机视觉的经典算法,例如目标检测、光流与跟踪等,继而进入深度学习部分,深入讲解如何将卷积神经网络应用于物体分类、目标检测等实际问题,最后介绍最新的GAN网络。为了让读者更好地了解传统计算机视觉和深度学习计算机视觉的区别,第13章详细介绍了传统计算机视觉和深度学习计算机视觉关于人脸识别方法的对比。
本书特点
1 通俗易懂,作为入门类图书,不用大量的数学公式,也不用复杂的术语,而是用通俗易懂的语言、形象生动的例子、栩栩如生的图片带领读者进入计算机视觉的世界。本书尽量以简单、易懂的方式将数学公式呈现给读者。即使是新入门的读者,也不会有任何阅读困难。
2 原理与实战相结合,作为计算机编程类图书,本书并非列举编程库或是编程函数,而是将原理与实战相结合,既阐明深刻的原理,又将所学应用到真正的实战项目,如人脸识别、车牌识别等,让读者学会OpenCV、TensorFlow等平台的函数及用法。
3 抽丝剥茧、深挖本质。计算机视觉往往涉及种类繁多的模型和各式各样的特征。本书在讲解新的网络架构或是算法时,透过其繁杂的表面,深挖其本质。
4 横向比较: 同一个问题往往有很多种不同的算法,例如目标检测问题就有RCNN、YOLO、SSD三大网络,它们各有千秋,我们要取其精华,去其糟粕。 纵向对比: 同一个实际问题,有传统计算机视觉的解决方案,也有深度学习计算机视觉的解决方案,如最常用的人脸识别,要分析不同方案的优劣,适合应用的场景。
本书对所有涉及的技术点进行了背景介绍,写作风格严谨。书中所有的代码执行结果都是自动生成的,任何改动都会触发对书中每一段代码的测试,以保证读者在动手实践时能复现结果。
由于笔者水平有限,书中难免存在疏忽,敬请原谅,并恳请读者批评指正。
余海林翟中华
2020年7月
本书源代码下载
|
|