新書推薦:

《
何谓好生活?——伦理学的回答(明德经典人文课)
》
售價:NT$
403.0

《
易学史(全三卷)
》
售價:NT$
908.0

《
黄帝内经精讲
》
售價:NT$
551.0

《
沉浸式元宇宙商业应用指南
》
售價:NT$
704.0

《
革命之风:殖民地大撤退与非洲的独立之路(1945—1975)
》
售價:NT$
352.0

《
温病类证论治
》
售價:NT$
1163.0

《
海上墨林:大师眼中的海派画家
》
售價:NT$
449.0

《
赌注:海难、叛变和谋杀的故事
》
售價:NT$
352.0
|
編輯推薦: |
※ 聚焦检索增强生成RAG与图检索增强生成GraphRAG。
※ 详解向量数据库、知识图谱增强与图模互补应用范式。
※ 涵盖知识增强大模型的大量应用场景与案例,技术剖析与实践指南兼备。
※ 复旦大学教授黄萱菁作序力荐。哈尔滨工业大学长聘教授、博导秦兵,科大讯飞副总裁、科大讯飞研究院执行院长王士进,硅基流动创始人兼CEO袁进辉等给予好评。
|
內容簡介: |
全书共分10 章,全面介绍知识增强大模型涉及的各类技术,涵盖大模型、向量数据库、图数据库、知识图谱、检索增强生成、GraphRAG 等内容,并辅以丰富的实例、精心绘制的插图和深入浅出的技术解析,帮助读者快速掌握知识增强大模型的理论,引导读者逐步构建知识增强大模型应用。
本书既可以作为人工智能相关的技术从业者、企业或机构管理者的工具书,指导实际工作;也适合作为人工智能、计算机等相关专业高年级本科生或研究生学习知识增强大模型应用开发的入门图书和进阶指南。
|
關於作者: |
王文广,高级工程师,浙江大学硕士,浦东新区“明珠计划”菁英人才,省部级科技进步奖获得者,人工智能标准编制专家,浦东新区首席技师,腾讯云最具价值专家(TVP),中国人工智能产业发展联盟突出贡献个人,曾出版《知识图谱:认知智能理论与实战》一书,致力于推进通用人工智能技术的研究和应用。
现为上海市人工智能标准化技术委员会委员、上海市科学技术委员会评审专家、中国计算机学会(CCF)高级会员、中国中文信息学会(CIPS)语言与知识计算专委会委员、中国人工智能学会(CAAI)深度学习专委会委员、上海市人工智能技术协会专委会委员,曾参与编制十余项(篇)人工智能领域的标准,发表数十项人工智能领域的国家发明专利和学术论文,并参与编写多本人工智能方面的图书。
|
目錄:
|
第1章 绪论:迎接大模型纪元 0
1.1 大模型崛起 2
1.2 大模型的固有特性 4
1.2.1 幻觉 5
1.2.2 知识陈旧 6
1.3 知识增强大模型 6
1.4 迎接大模型纪元 8
第2章 大语言模型 10
2.1 大模型概述 12
2.2 语言模型简史 14
2.3 大模型为何如此强大 20
2.3.1 语言模型与无监督学习 21
2.3.2 人类反馈强化学习 22
2.3.3 情境学习与思维链 24
2.4 如何使用大模型 29
2.4.1 翻译 30
2.4.2 文本摘要 31
2.4.3 求解数学问题 31
2.4.4 语言学习和考试 32
2.4.5 高效撰写文章 34
2.4.6 自动化编程和辅助编程 35
2.4.7 数据分析 38
2.5 垂直大模型 40
2.5.1 什么是垂直大模型 41
2.5.2 垂直大模型的特点 41
2.6 思考题 42
2.7 本章小结 43
第3章 向量数据库 44
3.1 向量表示与嵌入 46
3.1.1 语言的向量表示 47
3.1.2 图像的向量表示 48
3.1.3 知识图谱的向量表示 49
3.2 向量相似度 49
3.2.1 L2距离 50
3.2.2 余弦相似度 51
3.2.3 内积相似度 52
3.2.4 L1距离 53
3.3 向量索引与检索方法 54
3.3.1 最近邻检索和近似最近邻检索 55
3.3.2 局部敏感哈希算法 56
3.3.3 基于图结构的HNSW算法 58
3.3.4 向量量化与乘积量化 63
3.4 Milvus向量数据库 65
3.4.1 Milvus架构 66
3.4.2 向量索引方法 68
3.4.3 向量检索方法 70
3.4.4 数据一致性 70
3.4.5 用户认证与权限控制 72
3.5 Milvus向量数据库实战指南 73
3.5.1 安装、配置和运行Milvus 73
3.5.2 连接服务器和创建数据库 75
3.5.3 数据准备 76
3.5.4 创建集合 77
3.5.5 创建索引 80
3.5.6 插入数据 81
3.5.7 载入数据 82
3.5.8 标量查询 83
3.5.9 单向量检索 84
3.5.10 混合检索 87
3.6 其他主流的向量数据库系统与工具 91
3.6.1 原生向量数据库 91
3.6.2 数据库的向量处理扩展 92
3.6.3 向量索引和检索库 93
3.7 思考题 94
3.8 本章小结 94
第4章 检索增强生成 96
4.1 检索增强生成概述 98
4.2 为什么需要RAG 99
4.2.1 RAG、SFT与LoRA 99
4.2.2 长上下文与RAG 102
4.2.3 锂电池供应链管理案例 103
4.2.4 RAG的特点 105
4.3 通用的RAG流程 106
4.3.1 创建知识库 107
4.3.2 知识检索 107
4.3.3 大模型生成答案 108
4.3.4 质量评估与迭代优化 109
4.4 使用Dify构建RAG系统 110
4.4.1 Dify概述 110
4.4.2 安装Dify 111
4.4.3 初始化Dify 115
4.4.4 创建知识库 116
4.4.5 简单的RAG应用 119
4.4.6 RAG效果优化 121
4.4.7 引入Elasticsearch 123
4.4.8 构建RAG系统 129
4.5 RAG系统的最佳实践 135
4.5.1 文本分块 135
4.5.2 分层检索 136
4.5.3 查询改写 137
4.5.4 检索路由 138
4.6 其他主流的RAG系统框架 138
4.6.1 LobeChat 138
4.6.2 Quivr 139
4.6.3 LlamaIndex 139
4.6.4 Open WebUI 139
4.7 思考题 140
4.8 本章小结 140
第5章 知识图谱技术体系 142
5.1 什么是知识图谱 144
5.1.1 知识图谱的相关概念及其定义 144
5.1.2 知识图谱实例 146
5.1.3 大脑的联想机制与知识图谱的关系建模 147
5.2 DIKW模型与知识图谱 149
5.2.1 DIKW模型 149
5.2.2 从DIKW模型到知识图谱 150
5.2.3 知识图谱的内涵与外延 151
5.2.4 知识的源流与知识图谱 152
5.3 知识图谱的技术体系 153
5.3.1 知识图谱模式设计与管理 153
5.3.2 知识图谱构建技术 154
5.3.3 知识图谱存储技术 156
5.3.4 知识图谱应用技术 156
5.3.5 用户接口与界面 158
5.4 知识图谱模式设计的基本原则 159
5.4.1 赋予一类事物合适的名字 159
5.4.2 建立事物间清晰的联系 160
5.4.3 明确且正式的语义表达 161
5.5 知识图谱模式设计的六韬法 162
5.6 大模型结合六韬法设计知识图谱模式 165
5.6.1 场景:对齐参与各方的认知 166
5.6.2 复用:站在巨人的肩膀上 168
5.6.3 事物:定义实体类型及属性 169
5.6.4 联系:场景需求之下的普遍联系 173
5.6.5 约束:多层次的约束规范 176
5.6.6 评价:迭代优化的起点 182
5.7 知识图谱模式设计的最佳实践 182
5.7.1 熟知知识图谱及其具体应用领域 183
5.7.2 明确边界,切记贪多嚼不烂 183
5.7.3 高内聚、低耦合 184
5.7.4 充分利用可视化工具 185
5.8 思考题 186
5.9 本章小结 187
第6章 构建知识图谱 188
6.1 知识图谱构建技术概述 190
6.1.1 映射式构建技术 190
6.1.2 抽取式构建技术 192
6.2 抽取实体和实体属性 193
6.2.1 实体、实体属性及其抽取 193
6.2.2 用大模型抽取实体和实体属性 196
6.3 抽取关系和关系属性 205
6.3.1 实体间的关系和关系抽取 205
6.3.2 用大模型抽取关系和关系属性 210
6.4 抽取事件 214
6.4.1 事件、事件要素和事件抽取 214
6.4.2 用大模型抽取事件 217
6.5 多语言和跨语言 222
6.6 知识抽取的评价指标 223
6.7 思考题 226
6.8 本章小结 227
第7章 图数据库与图计算 228
7.1 图数据库概述 230
7.1.1 顶点、边、属性与标签 230
7.1.2 图数据库的存储与查询 231
7.1.3 主流的图数据库 231
7.2 JanusGraph分布式图数据库 232
7.2.1 JanusGraph系统架构 233
7.2.2 CAP理论与JanusGraph 234
7.2.3 与搜索引擎的集成 235
7.2.4 事务和故障修复 235
7.2.5 属性图模式的定义 236
7.2.6 图查询语言Gremlin 237
7.3 JanusGraph实战指南 238
7.3.1 安装、运行和配置JanusGraph 238
7.3.2 在JanusGraph中定义属性图模式 243
7.3.3 为图创建索引 247
7.3.4 索引的状态及动作 251
7.3.5 查看属性图模式 252
7.3.6 为图插入顶点、边和属性 254
7.3.7 查询的起始与终末 258
7.3.8 提取图中元素的信息 259
7.3.9 过滤查询条件 260
7.3.10 图的游走 262
7.3.11 分组与聚合 263
7.3.12 分支与循环 265
7.3.13 match、map、filter和sideEffect 266
7.3.14 性能优化工具的使用 267
7.4 JanusGraph的可视化 269
7.4.1 JanusGraph-Visualizer 269
7.4.2 其他可视化工具 270
7.5 遍历与最短路径算法 271
7.5.1 广度优先搜索 271
7.5.2 深度优先搜索 272
7.5.3 路径和最短路径 274
7.6 中心性 276
7.6.1 中心性的概念及应用 276
7.6.2 度中心性 277
7.6.3 亲密中心性 279
7.6.4 中介中心性 280
7.6.5 特征向量中心性 282
7.6.6 PageRank 283
7.7 社区检测 285
7.7.1 社区检测概述 285
7.7.2 社区检测算法一览 286
7.7.3 Leiden算法实战 289
7.7.4 社区检测算法的应用场景 292
7.8 思考题 294
7.9 本章小结 294
第8章 图模互补应用范式 296
8.1 图模互补概述 298
8.2 图模互补中的知识图谱 299
8.2.1 知识的确定性和一致性 299
8.2.2 知识来源可追溯 299
8.2.3 知识的实时与及时更新 300
8.2.4 可解释与可追溯的演绎推理 301
8.2.5 纠错机制与知识的持续维护 301
8.2.6 基于图机器学习与图神经网络的概率推理 301
8.2.7 知识图谱的全局视野 302
8.3 图模互补中的大模型 302
8.3.1 从任务描述到任务需求的理解 302
8.3.2 利用知识图谱检索、整合和推理结果 303
8.3.3 高质量的自然语言生成 303
8.3.4 结合多源知识生成创新性内容 305
8.3.5 概率推理能力与通用性 306
8.3.6 知识抽取 306
8.3.7 知识补全 306
8.3.8 跨语言知识对齐 307
8.4 图模互补应用范式的特点 307
8.5 大模型对知识图谱的增强 308
8.5.1 增强知识图谱的构建 308
8.5.2 增强知识图谱的补全 310
8.5.3 增强对知识的描述 310
8.5.4 增强知识图谱的推理 312
8.5.5 增强知识图谱的查询 312
8.6 知识图谱对大模型的增强 313
8.6.1 减少大模型的幻觉 313
8.6.2 内嵌知识图谱的大模型 314
8.6.3 提升大模型的推理能力 315
8.6.4 知识图谱增强生成 316
8.6.5 提升大模型生成内容的可解释性 316
8.6.6 应用案例 318
8.7 基于图模互补应用范式的智能系统的典型流程 318
8.8 思考题 320
8.9 本章小结 321
第9章 知识图谱增强生成与GraphRAG 322
9.1 知识图谱增强生成的原理 324
9.1.1 深度推理和实时推理 324
9.1.2 全局视野与深度洞察 325
9.1.3 知识整合 326
9.2 知识图谱增强生成的通用框架 327
9.3 为知识图谱创建索引 327
9.3.1 图索引 328
9.3.2 文本索引 328
9.3.3 向量索引 329
9.3.4 混合索引 329
9.4 从知识图谱中检索知识 329
9.4.1 检索方法 330
9.4.2 检索过程 331
9.4.3 知识粒度 334
9.5 知识表示形式 335
9.5.1 邻接表和边表 335
9.5.2 自然语言文本 336
9.5.3 编程语言 336
9.5.4 语法树 341
9.5.5 顶点序列 341
9.6 GraphRAG概述 341
9.7 GraphRAG实战 344
9.7.1 安装GraphRAG和数据资源准备 344
9.7.2 转换为实体的关系属性的DataFrame 346
9.7.3 计算实体、关系的排序值 347
9.7.4 为实体生成描述文本及向量化 347
9.7.5 为关系生成描述文本及向量化 348
9.7.6 社区分类和社区描述文本 349
9.7.7 调用API生成GraphRAG可用数据 354
9.7.8 大模型的初始化 355
9.7.9 局部搜索与全局搜索 355
9.8 思考题 358
9.9 本章小结 358
第10章 知识增强大模型应用 360
10.1 应用框架 362
10.2 知识来源 363
10.2.1 非结构化知识 363
10.2.2 结构化数据库 364
10.2.3 知识图谱 365
10.3 知识运营 366
10.3.1 知识的质量 366
10.3.2 数据管理流程 367
10.3.3 法律合规、隐私与知识产权 368
10.3.4 可观测性工具 368
10.4 应用指南 369
10.4.1 应用价值 370
10.4.2 面向进取者:全面推进的策略 371
10.4.3 面向保守者:试点驱动的策略 372
10.4.4 选型的“四三二一”原则 373
10.4.5 最佳实践要点 374
10.5 行业应用案例 375
10.5.1 文档助手 375
10.5.2 教育领域应用场景 377
10.5.3 智慧金融应用场景 378
10.5.4 智慧医疗应用场景 381
10.5.5 智能制造应用场景 383
10.6 思考题 386
10.7 本章小结 386
附录A 388
附录B 389
参考文献 390
|
內容試閱:
|
※编写背景※ 一个宏大的叙事
我们正处在一个充满变革与机遇的时代,见证着技术的进步和应用的百花齐放。大语言模型的迅猛发展,让我们看到了通用人工智能(AGI)的曙光和充满无限可能的未来图景。
2022年11月,ChatGPT横空出世,我第一时间就开始使用并为之着迷,而后全身心地投入对大模型的研究与应用中。2023年春节假期,我写了一篇文章《NLP奋发五载,AGI初现曙光》,全面梳理了大语言模型自2018年以来取得的令人瞩目的成就,并展望可能到来的AGI时代的壮丽蓝图。
从2023年开始,AGI被广泛讨论,逐渐成为全球的热点。我深刻感受并深度参与了大模型与AGI的“热浪”——从训练和微调模型、大模型的应用开发,到研读论文、撰写文章,再到讨论、直播和演讲。在深度探索、广泛实践和理性分析的过程中,我逐渐认识到:大模型带来的改变无疑是革命性的,但大模型并不是万能的,而是存在一定的局限性。
我深入研究了人工智能的历史,阅读了300多篇(本)20世纪40年代至2024年人工智能领域的重要学术论著,并在2024年春节期间撰写了文章《以史为鉴:人工智能技术的过去、现在与未来》。我发现,类似的对新技术的狂热追逐和宏大叙事并不是个例,历史上早有诸多先例。例如,当下被热议的“智能涌现”并不是一个崭新的概念。2024年诺贝尔物理学奖得主约翰·霍普菲尔德早在1982年发表的论文“Neural Networks and Physical Systems with Emergent Collective Computational Abilities”中,便探讨了具有涌现计算能力的神经网络。这种对复杂系统中自发生成智能的研究,正是如今许多人工智能理论的先声。由山姆·奥特曼和杰弗里·辛顿等人工智能领袖提出的“通用人工智能”愿景也并非“首创”。早在1967年,人工智能领袖马文·明斯基便在其著作Computation: Finite and Infinite Machines中提出,“我相信,在一代人的时间内,机器将具备几乎所有人类智能的能力——创建‘人工智能’的难题将会被实质性地解决。”
仰望星空与脚踏实地
回顾人工智能的历史,人类对智能机器的追求从未止步。人类一直试图赋予机器只有人类具备的能力——理解、学习、推理,甚至觉察自身。大模型代表着人工智能的巨大进步,我也坚定地全身心投入其中,并憧憬着未来的无限可能。我坚信人工智能的未来发展必将远超我们的想象,我也坚信人工智能的未来建立在更深入、更广泛的应用之上。这需要我们脚踏实地,从实际出发,理性探索人工智能的能力边界。大模型的能力强大,其在生产工具、生活应用中的深度与广度将被进一步扩展,然而,我们也要深刻认识到大模型的“能”与“不能”,夯实基础。
大模型应用的“阿喀琉斯之踵”
当将大模型的应用落地到相应的行业领域时,大模型的“阿喀琉斯之踵”出现了——幻觉和知识陈旧。幻觉,即大模型“凭空捏造”,生成与事实不符的内容。知识陈旧,是指大模型无法及时更新知识,导致生成的内容与现实情况脱节。如果不能解决这两个问题,基于大模型构建的智能系统就无法做到可靠和可信,就难以成为真正的生产力工具。试想:如果大模型生成的分析报告引用了虚假的市场数据,那么其不仅毫无价值,还可能造成严重的经济损失;如果医疗诊断大模型基于幻觉或陈旧的知识对疾病进行诊断,那么其后果可能会危及患者的生命。
然而,这两个问题难以依靠大模型自身来解决。根本原因在于,现在的大模型本质上是静态的,其生成能力依赖于训练时储备的知识,而非实时动态更新的知识。若要解决这两个问题,就不得不借助另外两种技术——检索增强生成与知识图谱。检索增强生成通过实时检索外部信息,弥补了大模型在知识广度与时效性上的不足。知识图谱则提供了一种不可或缺的逻辑支撑——不仅为大模型生成的内容提供新鲜的知识和结构化的语义框架,而且让生成结果具备更好的一致性和准确性。在图模互补应用范式中,知识图谱为大模型生成的内容赋予了逻辑脉络,使大模型不仅能“说得出来”,还能“说得对”。
《知识增强大模型》应运而生
技术不是空中楼阁,必须扎根于真实的需求之中。唯有如此,大模型才能广泛并深入地渗透到生产和生活的方方面面,AGI的宏伟愿景才能从理想照进现实。我相信,未来十年,基于大模型的智能系统将嵌入日常工作和生活中所用的每一个软件,如空气般无所不在。我将自己自2022年年底至今在大模型领域的思考、探索与实践总结成书,《知识增强大模型》这本书就是在这样的背景下诞生的。
本书聚焦于通过外部知识增强的方法实现可靠、可信的大模型应用。需要强调的是,知识增强并非对大模型能力的否定,而是与大模型相辅相成,共同解决实际需求的有效途径,也是推进并最终实现AGI的关键一环。
我希望本书能够为渴望理解与拥抱AGI的读者提供启发,帮助大家穿越技术的迷雾,迎接大模型纪元;也希望本书能够成为迈向AGI新时代旅途中的一座补给站,为人类构建更加美好的未来贡献一份力量。我真诚期待与每一位读者携手踏上这段充满希望与创造力的征程!
※本书内容※
全书共分10章,全面介绍知识增强大模型涉及的各类技术,并通过丰富的实例解析如何用好相关技术。
第1章概述大模型、大模型幻觉与知识陈旧的固有特性、知识增强大模型等概念,并对大模型纪元做简要的展望。
第2章详细介绍大模型的相关技术及使用方法。
第3章和第4章围绕文档类知识增强展开。
第3章详细介绍向量表示及向量的相似性度量、向量数据库和基于向量的语义检索等内容,并介绍Milvus向量数据库的实战指南,以及其他主流的开源向量数据库。
第4章介绍检索增强生成的概念、技术,以及基于开源框架Dify构建RAG系统。在向量检索方面,探讨文本分块相关的内容,并介绍基于搜索引擎Elasticsearch的文本检索方法,将其与向量检索进行比较和配合。
第5章至第9章围绕知识图谱增强展开。
第5章全面讲解知识图谱技术体系,并详细论述如何将大模型和“六韬法”相结合设计知识图谱模式。大模型和六韬法的组合既是设计专业领域的知识图谱的利器,也是知识图谱增强生成实现产业应用的基础。
第6章全面论述知识图谱的映射式构建技术和抽取式构建技术,深入探讨如何利用大模型来抽取实体、关系、属性和事件,进而构建知识图谱。
第7章详细介绍JanusGraph分布式图数据库和基于数据库的图计算方法,并介绍如何在Python环境中使用Gremlin操作JanusGraph图数据库和实现图计算。
第8章系统阐述图模互补应用范式的相关内容,涵盖知识图谱增强大模型和大模型增强知识图谱等。
第9章深入介绍知识图谱增强生成的原理、通用框架和方法,并以GraphRAG为基础,介绍知识图谱增强生成的应用。
第10章从应用框架、知识来源、知识运营、应用指南等角度,全面介绍知识增强大模型的应用方法,给出一个知识增强应用的案例——文档助手,并结合教育、智慧金融、智慧医疗和智能制造领域的应用场景给出具体案例。
※本书特色※
本书内容丰富、体系完整、布局有序、案例翔实,理论与实践兼顾,深度与广度并重,既适合初学者,也适合进阶学习者。书中包含大量精心绘制的插图、丰富的实践案例和深入浅出的技术解析,帮助读者快速掌握知识增强大模型的理论,引导读者从零开始构建知识增强大模型应用,从实践层面了解应用价值,提升自身技能。值得一提的是,第2章到第10章配有思考题,帮助读者拓展思维,深化理解,激发创新意识,思考人工智能理论和应用的未来发展。
本书主要面向以下三类读者。
人工智能技术工作者:本书涵盖大模型、向量数据库、图数据库、知识图谱、RAG、GraphRAG等被广泛应用的技术,并辅以丰富的实例,既可作为技术工作者学习知识增强大模型应用开发的入门图书和进阶指南,也可作为指导实际工作的参考工具书。企业或机构的管理者:本书有助于管理者全面了解大模型的潜力,客观评估大模型的能力,避免因对大模型能力的高估或低估而产生误判或错误决策,并可协助管理者在企业或机构中精准定位和有效落地大模型。高校师生:本书可作为人工智能、计算机等相关专业高年级本科生或研究生的教材和参考用书。第2章到第10章的思考题可作为学习内容的拓展,激发学生思考,培养创新思维。第10章的“文档助手”部分可作为课程实践项目。
|
|