新書推薦:

《
防患于未“燃”:故宫历史上的火灾与消防(在故宫) 探秘故宫防火智慧 解码古建营造技艺
》
售價:NT$
403.0

《
从家族企业到商业世家:创业家族世代繁荣的路线图
》
售價:NT$
403.0

《
敦煌石窟乐舞图像研究
》
售價:NT$
857.0

《
剑桥俄国史:第一卷 从早期罗斯到1689年
》
售價:NT$
1250.0

《
原来数学还可以这样学
》
售價:NT$
407.0

《
典籍里的中国 第二辑
》
售價:NT$
653.0

《
108种手艺1:中国人的生活美学 王的手创非物质文化遗产的全新再现。以鲜活的一手内容全面展现优秀传统手艺
》
售價:NT$
1010.0

《
宁来一梦
》
售價:NT$
458.0
|
內容簡介: |
本书详尽地探讨了变分自编码器、生成对抗网络、标准化流模型和扩散模型这四大主流生成式视觉模型。本书不仅深入解析了这些模型背后的复杂数学原理、训练及采样算法,还提供了详细的代码实现指南。秉承\理论与实践并重”的理念,本书进一步探索了生成式视觉模型在不同场景中的应用实例,并精选了4个具有代表性的实战案例进行深度剖析。这些案例紧密贴合实际业务需求与面临的技术挑战,旨在引导读者掌握利用生成式视觉模型解决现实问题的方法论,同时通过动手实践增强其编程技能与技术优化能力。 本书适合具有大学本科数学基础(包括微积分、线性代数、概率统计)及机器学习、深度学习等知识,并熟悉Python及PyTorch编程的本科生、研究生,或者相关领域的研究人员阅读与学习。
|
關於作者: |
丁鑫,博士,副教授,国家海外引进人才计划(青年项目)入选者,主要从事生成式人工智能的研究工作;主持国家自然科学基金青年项目1项;以第一作者身份先后在IEEE TPAMI、IEEE TSP、ESWA、ICLR、AAAI等高水平国际期刊或会议上发表论文10余篇;担任AAAI、IJCAI、IEEE SPL等国际知名会议和期刊的审稿人与程序委员会成员。
|
目錄:
|
目录
第1章 生成式人工智能概述1
1.1 生成式人工智能:引领生产力的飞跃1
1.1.1 ChatGPT1
1.1.2 Sora2
1.1.3 应用前景与意义2
1.2 生成式人工智能的发展历程3
1.2.1 从统计学习到深度学习前夕3
1.2.2 深度学习时代4
1.2.3 大模型时代5
1.3 生成式人工智能的发展方向6
1.4 生成式人工智能的伦理问题7
1.5 习题9
1.6 参考文献9
第2章 生成式建模与评价指标10
2.1 根本任务10
2.1.1 分布估计11
2.1.2 样本生成12
2.1.3 针对数字图像的生成式建模12
2.2 典型生成模型13
2.3 评价指标15
2.3.1 负对数似然15
2.3.2 基于距离或散度的评价指标16
2.3.3 精确率和召回率21
2.3.4 统计检验22
2.3.5 用生成样本训练分类器22
2.3.6 过拟合检测23
2.4 重要意义23
2.5 习题24
2.6 参考文献24
第3章 VAE25
3.1 预备知识25
3.1.1 AE25
3.1.2 KL散度26
3.1.3 MLE27
3.1.4 条件编码27
3.1.5 马尔可夫链29
3.1.6 重参数化技巧30
3.2 数学符号31
3.3 总体思路31
3.4 理论分析33
3.4.1 证据下界33
3.4.2 目标函数34
3.5 模型结构36
3.5.1 推断网络36
3.5.2 生成网络37
3.5.3 VAE与AE的对比37
3.6 训练算法38
3.7 采样算法39
3.7.1 后验采样39
3.7.2 先验采样40
3.8 变体模型41
3.8.1 CVAE41
3.8.2 Beta-VAE42
3.8.3 MHVAE42
3.8.4 VQ-VAE43
3.9 代码实践:VAE44
3.9.1 数据载入与实验设置45
3.9.2 推断网络和生成网络46
3.9.3 模型训练49
3.9.4 采样与可视化50
3.10 习题51
3.11 参考文献52
第4章 GAN53
4.1 预备知识53
4.1.1 JS散度53
4.1.2 Wasserstein距离54
4.1.3 Lipschitz连续函数55
4.1.4 MMD55
4.1.5 拒绝采样56
4.2 原始GAN57
4.2.1 生成器与判别器57
4.2.2 损失函数与训练算法58
4.2.3 如何理解生成器的本质60
4.2.4 理论最优判别器60
4.2.5 为什么GAN是生成模型61
4.2.6 梯度消失问题62
4.2.7 模式坍缩问题63
4.3 CGAN64
4.3.1 重要的生成式建模范式64
4.3.2 模型结构65
4.3.3 损失函数与训练算法66
4.3.4 模型分析67
4.4 变体模型68
4.4.1 损失函数68
4.4.2 网络架构73
4.4.3 正则化81
4.4.4 条件输入方法84
4.4.5 一维连续条件87
4.4.6 隐变量解耦89
4.4.7 数据增强91
4.4.8 二次采样93
4.4.9 大模型技术94
4.4.10 典型应用95
4.5 代码实践:DCGAN99
4.5.1 实验设置99
4.5.2 生成器与判别器100
4.5.3 模型训练102
4.5.4 采样与可视化105
4.5.5 性能比较106
4.6 习题108
4.7 参考文献108
第5章 NF模型111
5.1 NF模型基础111
5.1.1 变量替换定理111
5.1.2 雅可比行列式的性质与计算112
5.1.3 多步变换后的概率分布114
5.2 NF模型的训练和采样115
5.2.1 NF模型的训练115
5.2.2 NF模型的采样116
5.2.3 NF模型的实现116
5.3 如何构造一个NF模型118
5.3.1 仿射流118
5.3.2 平面流和径向流120
5.3.3 耦合流122
5.3.4 自回归流125
5.3.5 可逆残差流128
5.4 连续时间下的NF模型132
5.5 代码实践:RealNVP135
5.5.1 实验设置135
5.5.2 NF模型的构建135
5.5.3 训练过程138
5.5.4 性能比较139
5.6 习题139
5.7 参考文献140
第6章 DM142
6.1 预备知识142
6.1.1 Stein’s分数函数142
6.1.2 Tweedie’s公式143
6.1.3 随机微分方程143
6.2 VDM144
6.2.1 从VAE到VDM144
6.2.2 变种损失函数158
6.2.3 方差表163
6.2.4 经典模型:DDPM166
6.2.5 跨步采样:DDIM168
6.2.6 隐扩散模型:LDM171
6.3 SGM172
6.3.1 SGLD172
6.3.2 SBM与分数匹配172
6.3.3 朴素SGM及其问题173
6.3.4 带有多尺度噪声扰动的SGM174
6.3.5 基于随机微分方程的SGM175
6.4 条件扩散模型180
6.4.1 分类器指导180
6.4.2 无分类器指导181
6.5 代码实践:DDPM182
6.5.1 实验设置182
6.5.2 网络定义183
6.5.3 扩散过程188
6.5.4 训练过程193
6.5.5 性能比较194
6.6 习题195
6.7 参考文献196
第7章 生成模型应用实战198
7.1 典型应用场景198
7.1.1 可控图像生成198
7.1.2 图像翻译199
7.1.3 图像超分辨率199
7.1.4 图像修复200
7.1.5 图像分割201
7.1.6 图像编辑201
7.2 实战案例1:图像风格迁移202
7.2.1 案例介绍202
7.2.2 实验效果203
7.3 实战案例2:医疗影像的模态变换204
7.3.1 案例介绍204
7.3.2 实验效果204
7.4 实战案例3:遥感图像的超分辨率重建205
7.4.1 案例介绍205
7.4.2 实验效果206
7.5 实战案例4:Stable Diffusion文生图207
7.5.1 Stable Diffusion简介207
7.5.2 本地部署207
7.6 参考文献209
|
|