新書推薦:

《
历史动力学:帝国的兴衰密码
》
售價:NT$
500.0

《
广岛 普利策奖得主首次揭示原子弹爆炸真相 20世纪美国百佳新闻作品TOP1
》
售價:NT$
296.0

《
清末民初的“问题”与“主义”
》
售價:NT$
485.0

《
新中式服装设计、制板与裁剪
》
售價:NT$
449.0

《
诗经译注(彩图珍藏本)
》
售價:NT$
1010.0

《
十九日极夜.完结篇
》
售價:NT$
281.0

《
明宫彤史:明代宫廷女性(一部好看又严谨的明代宫闱秘史)
》
售價:NT$
500.0

《
囚笼之家
》
售價:NT$
305.0
|
編輯推薦: |
面向本科院校、职业院校的人工智能通识教育需求。
从基础知识入手,重点着眼于生成式AI的核心技术。
结合近期人工智能爆发式增长的社会和教育热点。
全面介绍生成式人工智能在多个领域的落地应用。
配套提供电子课件、微课视频、教学大纲、教案、教学指导、作业集与答案。
|
內容簡介: |
生成式人工智能是当今科技领域的前沿热点技术。本书分为四个部分,共15章,全面系统地介绍了生成式AI的基础理论、核心技术、应用场景以及社会影响,既突出生成式AI技术,又重视AIGC应用,旨在为读者提供一个全面、深入且实用的学习平台,帮助读者快速掌握生成式AI和AIGC的精髓及其在各领域的应用实践。
本书内容丰富、结构清晰、理论与实践相结合,既适合本科院校、职业院校相关专业的师生作为教材使用,也适合AI领域从业者、研究人员以及对AI技术感兴趣的读者自学参考。通过阅读本书,读者将能够全面了解生成式AI的核心技术与应用实践,掌握其在各领域的创新应用,为未来的职业发展和个人成长奠定坚实的基础。
|
關於作者: |
孙丹枫,杭州电子科技大学硕士生导师。主要研究方向:可编程控制技术、工业互联网、柔性制造等。现担任国际自动控制联合会(IFAC)技术委员会委员。近年来,主持国家自然科学青年基金、国家工信部工业互联网创新发展工程任务、国家重点研发计划子课题等多个重要国家、省部级项目;获浙江省科技进步奖一等奖、中国机械工业科学技术进步奖一等奖、中国科技产业化促进会科技创新奖一等奖等多个科研奖项;作为核心成员参与制定国家标准1项;已发表SCI论文20余篇、授权国家发明专利10余件。
|
目錄:
|
前言
第1章 人工智能基础 1
1.1 计算机的渊源 1
1.1.1 通用计算机 2
1.1.2 计算机的定义 2
1.2 大数据基础 2
1.2.1 大数据的定义 3
1.2.2 大数据的3V特征 3
1.3 AI时代 4
1.3.1 图灵测试及其发展 4
1.3.2 AI的定义 5
1.3.3 实现AI的三种途径 6
1.4 机器学习与深度学习 8
1.4.1 机器学习 8
1.4.2 深度学习 9
1.4.3 机器学习与深度学习的关系 11
1.5 人工智能发展中的“中国风” 11
1.5.1 世界AI发展的排头兵 11
1.5.2 AI领域的“东方神秘力量” 11
1.5.3 基于量化“幻方”的深度求索 12
1.5.4 宇树科技与四足机器人 13
1.5.5 游戏科学与《黑神话:悟空》 13
1.5.6 全球最大可交互三维能力的群核科技 13
1.5.7 中国AI企业应有的自信 14
【作业】 14
【研究性学习】探索AI在日常生活中的应用 16
第2章 生成式AI与AIGC 18
2.1 Blockhead思维实验 18
2.2 从自然语言处理起步 19
2.2.1 NLP研究内容 19
2.2.2 深度学习的影响 20
2.2.3 LLM崛起 21
2.2.4 LLM特征 21
2.3 生成式人工智能 22
2.3.1 什么是判别式AI 22
2.3.2 定义生成式AI 23
2.3.3 生成式AI的层次 24
2.3.4 定义AIGC 26
2.3.5 生成式AI与AIGC的关系 27
2.4 智能内容生成 27
2.4.1 内容孪生 27
2.4.2 内容编辑 28
2.4.3 内容理解 28
2.5 生成式AI应用场景 29
【作业】 30
【研究性学习】熟悉阿里云大模型“通义千问” 32
第3章 大语言模型技术 35
3.1 算法、算力与算料 35
3.1.1 算法:人工智能的智慧之源 35
3.1.2 算力:人工智能的动力引擎 36
3.1.3 算力中的GPU 36
3.1.4 DeepSeek带来的启迪 37
3.1.5 算料:人工智能的燃料之源 37
3.2 LLM的工作原理 38
3.2.1 词元及其标记化 38
3.2.2 基础模型 38
3.2.3 词嵌入及其含义 39
3.2.4 生成和理解 39
3.2.5 预训练与微调 39
3.3 生成对抗网络 40
3.3.1 GAN的基本原理 40
3.3.2 GAN的训练过程 41
3.3.3 不同类型的GAN 41
3.4 变分自编码器 43
3.4.1 VAE的工作机制 43
3.4.2 潜在空间探索 44
3.5 流模型 44
3.5.1 流模型应用场景 45
3.5.2 流模型应用案例 45
3.6 语言模型基础 46
3.7 接入LLM的几种方法 46
3.7.1 个人直接使用平台功能 47
3.7.2 通过平台搭建智能体 47
3.7.3 通过API调用 48
3.7.4 私有化本地部署 48
3.7.5 通过云服务商间接部署 48
3.7.6 渐进式接入 49
3.8 LLM的幻觉 49
3.8.1 产生幻觉的原因 49
3.8.2 减轻幻觉 50
【作业】 51
【研究性学习】LLM典型案例分析 53
第4章 提示工程与技巧 56
4.1 提示工程的定义 56
4.2 提示的原理 57
4.2.1 提示词分类 58
4.2.2 提示构成 59
4.2.3 提示调优 59
4.3 提示工程技术 59
4.3.1 链式思考提示 60
4.3.2 生成知识提示 60
4.3.3 少样本提示 61
4.3.4 自一致提示 61
4.3.5 思维树提示 62
4.4 提示学习和语境学习 63
4.4.1 提示学习 63
4.4.2 语境学习 64
4.5 提示词写作技巧 65
4.5.1 提示词框架推荐 65
4.5.2 提示词实践技巧 67
【作业】 68
【研究性学习】练习撰写提示词 70
第5章 文本生成技术 73
5.1 典型的语言模型方法 73
5.1.1 基于规则的方法 73
5.1.2 统计语言模型 74
5.1.3 循环神经网络及其变体 76
5.2 Transformer模型 77
5.2.1 位置编码机制 77
5.2.2 自注意力机制 78
5.2.3 Transformer过程 79
5.2.4 Transformer结构 82
5.2.5 Transformer模块 83
5.3 混合模型 83
5.4 典型的文本生成技术 83
5.4.1 文本摘要技术 84
5.4.2 诗歌生成 84
5.4.3 简单对话系统 84
5.4.4 翻译任务中的应用 85
【作业】 86
【研究性学习】熟悉AI助手Kimi 88
第6章 图像生成技术 90
6.1 图像生成的模型 90
6.1.1 扩散模型 90
6.1.2 自回归模型 91
6.1.3 图像生成的代表性模型 92
6.2 图像生成的应用场景 92
6.3 图像风格迁移 94
6.3.1 基本原理 95
6.3.2 代表性算法 95
6.4 超分辨率重建 96
6.4.1 基本原理 96
6.4.2 传统方法 97
6.4.3 基于学习的方法 97
6.5 视频生成 98
6.5.1 主要方法 98
6.5.2 代表性算法 98
6.6 医疗影像合成 99
6.6.1 主要方法 99
6.6.2 代表性算法 100
6.7 挑战与未来发展 100
【作业】 101
【研究性学习】基于深度学习的图像生成 103
第7章 音频生成技术 105
7.1 定义音频生成技术 105
7.1.1 音频与音乐 105
7.1.2 核心生成技术 106
7.2 波形建模 107
7.3 音乐旋律生成 108
7.4 语音合成 109
7.4.1 基本原理 109
7.4.2 主要方法 110
7.4.3 合成质量 110
7.4.4 用户定制 110
7.5 音频增强与修复 111
7.5.1 噪声减少 111
7.5.2 回声消除 111
7.5.3 音频修复 112
7.5.4 动态范围压缩 112
7.5.5 等化 113
7.5.6 时间拉伸与音高转换 113
7.5.7 用户交互与自动化 114
【作业】 116
【研究性学习】探索音乐旋律生成模型 118
第8章 多模态生成技术 120
8.1 多模态生成概述 120
8.1.1 技术基础 121
8.1.2 模型结构融合策略 121
8.2 视觉与文本结合 122
8.2.1 图像字幕生成 122
8.2.2 视觉问答 122
8.2.3 文生图的合成与编辑 123
8.2.4 生成中的情感一致性 123
8.2.5 案例:Muse文生图模型 124
8.3 跨媒体内容生成 124
8.3.1 图像到文本生成 124
8.3.2 跨媒体翻译 125
8.3.3 多模态对话系统 126
8.4 智能感知与响应 127
8.4.1 技术基础 127
8.4.2 制定响应决策 128
8.5 应用与发展 128
8.5.1 多模态生成的应用场景 128
8.5.2 技术挑战与发展趋势 130
【作业】 132
【研究性学习】多模态生成技术应用—“情感音乐可视化” 133
第9章 AIGC促进文化创意 136
9.1 文化创意应用场景 137
9.2 文学创作 137
9.2.1 AIGC用于文学创作 137
9.2.2 自动化写作工具 138
9.2.3 激发创意灵感 139
9.3 视觉艺术 139
9.3.1 图像生成与编辑 139
9.3.2 风格迁移 139
9.3.3 VR与AR 140
9.3.4 AI绘图工具 140
9.3.5 AIGC生成视频 142
9.4 音乐与音频制作 143
9.4.1 自动作曲 143
9.4.2 效果迁移与融合 144
9.4.3 音频处理与配乐 144
9.4.4 智能混音与母带处理 145
9.4.5 互动式音乐体验 145
9.5 影视娱乐 146
9.5.1 剧本开发与优化 146
9.5.2 视觉效果生成 146
9.5.3 智能剪辑与叙事结构 147
9.5.4 互动式影视体验 147
9.6 AIGC带来新商业模式 147
9.6.1 基于订阅的内容即服务 148
9.6.2 微内容与短格式媒体 148
9.6.3 版权保护与交易机制 148
【作业】 148
【研究性学习】文生图:注册使用Midjourney绘图工具 151
第10章 AIGC改善医疗健康 153
10.1 关于循证医学 153
10.2 AIGC在医疗行业中的应用 154
10.2.1 主要应用场景 155
10.2.2 展望与挑战 155
10.3 AIGC加速药物发现 156
10.3.1 AIGC用于药物发现 156
10.3.2 为流程各阶段增加价值 156
10.3.3 AIGC助力药物研究 157
10.4 AIGC应用在健康领域 157
10.4.1 个性化健康管理 157
10.4.2 健康教育与咨询 158
10.4.3 康复与治疗支持 158
10.5 医疗健康应用案例 159
10.5.1 医学影像诊断系统 159
10.5.2 智能病历管理系统 160
【作业】 161
【研究性学习】AIGC辅助临床医学决策 163
第11章 AIGC造就智慧城市 165
11.1 智能交通概述 165
11.1.1 智能交通要素 165
11.1.2 关键技术 167
11.1.3 主要应用 168
11.2 AIGC用于智能交通 169
11.3 AIGC与自动驾驶 169
11.3.1 车联网技术概述 170
11.3.2 AIGC应用于自动驾驶 171
11.4 智能城市与AIGC 173
11.4.1 智慧城市关键特点 173
11.4.2 智慧城市主要组成 174
11.4.3 AIGC应用于智慧城市 174
【作业】 175
【研究性学习】AIGC智能交通应用案例分析 177
第12章 AIGC提升金融服务 181
12.1 金融服务概述 181
12.2 AIGC应用于金融服务 182
12.2.1 智能客服 182
12.2.2 风险评估 184
12.2.3 个性化推荐 185
12.2.4 智能投顾 187
12.2.5 反欺诈系统 189
12.3 案例:智投宝智能投顾平台 190
12.4 案例:智安盾金融反欺诈系统 191
【作业】 192
【研究性学习】AIGC在金融服务中的应用探索 194
第13章 AIGC提高科研水平 197
13.1 AIGC应用于设计 197
13.1.1 AIGC的设计应用场景 197
13.1.2 AIGC与设计师的协同模式 198
13.2 数据增强与模拟 201
13.2.1 数据增强 201
13.2.2 科学模拟 201
13.2.3 自动化实验设计 201
13.2.4 模型训练与改进 202
13.2.5 理论验证与假设测试 203
13.3 合作与共享 204
13.3.1 跨学科合作 204
13.3.2 科研文献管理 205
13.3.3 开放科学与共享平台建设 206
13.4 AIGC科研应用案例 207
13.4.1 生命科学案例 207
13.4.2 材料科学案例 208
13.4.3 环境科学案例 208
13.4.4 社会科学案例 208
13.4.5 物理科学案例 208
【作业】 209
【研究性学习】AIGC在科研中的应用探索 211
第14章 伦理与法律考量 213
14.1 AIGC面临的伦理挑战 213
14.2 数据隐私保护对策 214
14.2.1 数据主权和数据权问题 214
14.2.2 数据利用失衡问题 214
14.2.3 构建隐私保护伦理准则 215
14.2.4 健全道德伦理约束机制 215
14.3 AI伦理原则 216
14.3.1 职业伦理准则的目标 216
14.3.2 创新发展道德伦理宣言 217
14.3.3 欧盟可信赖的伦理准则 218
14.3.4 封禁存在“不可接受风险”AI系统 219
14.4 LLM的知识产权保护 219
14.4.1 LLM的诉讼案例 219
14.4.2 尊重隐私,保障安全,促进开放 222
14.4.3 边缘群体的数字平等 223
【作业】 223
【研究性学习】AI独立完成的视觉艺术品无法获得版权 225
第15章 面向AGI 227
15.1 生成式AI进步 227
15.2 AGI的涌现 228
15.2.1 AGI的定义 229
15.2.2 龙头企业对AGI的认识 229
15.3 LLM与AGI 230
15.4 生成式AI与AGI 231
15.5 从生成式AI迈向AGI 231
15.5.1 迈向AGI的关键要素 232
15.5.2 面临的挑战 232
15.5.3 潜在的发展路径 233
15.6 AI的未来发展 233
【作业】 234
【课程学习与实践总结】 236
参考文献 240
|
內容試閱:
|
2022年11月30日,OpenAI公司对外发布了基于大语言模型(LLM)的AI聊天机器人程序ChatGPT,它展现出绝妙的人机交互体验,能够充分理解人类自然语言,可以用人类自然对话方式来交互,甚至让人们分不清和自己对话的是人还是机器。此外,它还可以用于更为复杂的语言工作,如自动生成文本、自动问答、自动摘要等多种任务。一时间,人们对其背后技术的了解和研究,对LLM和生成式AI技术的关注冲向了顶峰。
很快,中国的AI初创企业如雨后春笋般不断涌现。2025年初,发布了低成本、高性能生成式AI的DeepSeek(深度求索公司)在全世界爆红,成为在互联网巨头的资金和学术机构的人才支持下茁壮成长的“中华AI”,原本以美国企业为中心的AI性能竞争迎来全新局面。
生成式AI已经成为当今科技领域极具影响力和变革性的力量之一。它不仅推动了技术的进步,更深刻地改变了人们的生活方式、工作模式以及对世界的认知。本书旨在为读者提供一个全面、系统且深入的生成式AI知识体系,帮助读者更好地理解这一前沿技术,并探索其在各个领域的广泛应用。
生成式AI的发展历程是人类智慧与技术融合的典范。从早期的计算机技术发展,到大数据时代的到来,再到如今机器学习与深度学习的蓬勃兴起,每一步都为生成式AI的诞生奠定了坚实的基础。它不仅能够生成高质量的文本、图像、音频和视频内容,还能通过多模态融合技术实现跨领域的创新应用。这些技术的突破,使得生成式AI在文化创意、医疗健康、智慧城市、金融服务以及科学研究等多个领域展现出巨大的潜力和价值。
本书分为四个部分。在基础理论篇(第1、2章)中,深入探讨了人工智能(AI)的起源、大数据的特征以及机器学习与深度学习的关系,为读者构建一个坚实的理论框架。同时,通过对生成式AI的定义、层次和应用场景的介绍,帮助读者初步了解这一技术的核心概念和价值。
核心技术篇(第3~8章)是本书的重点,详细介绍了大语言模型技术、提示工程与技巧、文本生成技术、图像生成技术、音频生成技术以及多模态生成技术等关键领域。通过对技术的剖析,读者能够掌握生成式AI的核心原理和实现方法,并了解如何通过技术创新推动其发展。
应用场景篇(第9~13章)展示了生成式AI在文化创意、医疗健康、智慧城市、金融服务和科学研究等领域的广泛应用。通过丰富的案例和实践分析,读者将看到生成式AI如何为各个行业带来创新和变革,同时也将了解到其在实际应用中面临的挑战和未来的发展方向。
最后,社会影响篇(第14、15章)深入探讨了生成式AI所带来的伦理、法律和社会问题。从数据隐私保护到知识产权保护,从AI伦理原则到AGI(通用人工智能)的未来发展,本书将引导读者思考如何在技术进步的同时,确保其符合人类的价值观和社会利益。
在撰写本书的过程中,我们力求保证内容的全面性、准确性和可读性。希望本书不仅能够成为高校各专业人工智能通识教育用书和专业人士的参考书籍,也能为对生成式AI感兴趣的普通读者提供一个清晰易懂的入门指南。同时,我们鼓励读者在阅读本书的过程中,积极参与相关技术的研究和实践,探索生成式AI的无限可能。
生成式AI的概念、技术与应用是一门理论性和实践性都很强的必修课程。本书精心设计教学过程,每章都针对性地设计了课后作业和研究性学习环节。
本书的教学进度设计见课程教学进度表,该表可作为教师授课参考。实际执行时,教师可按照教学大纲安排教学进度,确定本课程的教学进度。
本课程的教学评测可以从以下几个方面入手,即:
(1)每章的课后作业(15项)。
(2)每章的“研究性学习”实践(14项)。
(3)第15章的“课程学习与实践总结”。
(4)学生针对每章内容写下的阅读笔记(建议)。
(5)平时考勤情况。
(6)授课老师认为有必要的其他评测方法。
本书特色鲜明、易读易学,适合本科院校、职业院校各专业学生学习,也适合对AI以及LLM、生成式AI、AIGC、AGI相关领域感兴趣的读者阅读参考。
本书配有授课电子课件、20讲微课教学视频以及丰富的教学资源,需要的教师可登录www.cmpedu.com免费注册,审核通过后下载,或联系编辑索取。
本书是杭州电子科技大学2025年度校级教材建设项目的建设成果之一。本书的编写得到杭州电子科技大学、浙大城市学院、浙江商业职业技术学院等多所院校师生的支持。参加本书编写工作的还有赵建勇、王文。欢迎教师与作者交流并索取与本书配套的相关教学资料。
由于作者水平有限,书中难免有疏漏之处,恳请读者批评指正。
|
|