登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入   新用戶註冊
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2024年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / 物流,時效:出貨後2-4日

2025年08月出版新書

2025年07月出版新書

2025年06月出版新書

2025年05月出版新書

2025年04月出版新書

2025年03月出版新書

2025年02月出版新書

2025年01月出版新書

2024年12月出版新書

2024年11月出版新書

2024年10月出版新書

2024年09月出版新書

2024年08月出版新書

2024年07月出版新書

『簡體書』零基础实战AI大模型:原理、构建与优化

書城自編碼: 4146343
分類: 簡體書→大陸圖書→計算機/網絡人工智能
作者: 袁重桥 编著
國際書號(ISBN): 9787122481931
出版社: 化学工业出版社
出版日期: 2025-09-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 505

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
大学问·清代银钱比价波动研究(重绘清代全国各省的银钱比价数据序列,为清代货币史、经济史的研究提供了有力的数据支撑)
《 大学问·清代银钱比价波动研究(重绘清代全国各省的银钱比价数据序列,为清代货币史、经济史的研究提供了有力的数据支撑) 》

售價:NT$ 709.0
荷马社会研究(增补版)
《 荷马社会研究(增补版) 》

售價:NT$ 765.0
万千心理·与弗洛伊德的咖啡漫语:一场跨越时空的对话【精装】
《 万千心理·与弗洛伊德的咖啡漫语:一场跨越时空的对话【精装】 》

售價:NT$ 704.0
内北国而外中国:蒙元史研究 精装 中华学术·有道
《 内北国而外中国:蒙元史研究 精装 中华学术·有道 》

售價:NT$ 755.0
山中岁月:在日本小镇与传统相遇、与自然相融
《 山中岁月:在日本小镇与传统相遇、与自然相融 》

售價:NT$ 306.0
创伤自救指南:如何摆脱消极模式、修复人际关系并获得自由
《 创伤自救指南:如何摆脱消极模式、修复人际关系并获得自由 》

售價:NT$ 301.0
失控的孤独
《 失控的孤独 》

售價:NT$ 286.0
怀疑:破解天才困惑与凡人焦虑的心理谜题
《 怀疑:破解天才困惑与凡人焦虑的心理谜题 》

售價:NT$ 408.0

內容簡介:
本书系统讲解了大模型的技术体系与应用实践。全书在深入解析Transformer和GPT系列模型的核心原理的基础上,介绍了中国优秀大模型DeepSeek的基本情况,重点讲解Llama开源模型的训练调优及行业应用开发,并对文生图、文生视频乃至多模态等前沿技术进行了探讨。本书注重理论与实践相结合,通过精选开源项目案例,引导读者在代码实践中理解技术本质。 本书适合人工智能相关专业学生参考,也可供对大模型开发感兴趣的技术人员及爱好者阅读学习。
目錄
第一章 大语言模型基础知识 001~037
第一节 LLM基础 003
一、LLM概述 003
二、大模型存在的问题 010
三、检索增强生成(RAG) 012
四、大模型的改进方法 014
第二节 GPT模型介绍 016
一、GPT模型的发展历程 018
二、GPT模型的关键论文 024
三、GPT模型的结构可视化 028
第三节 开源、工具和实战 034
第二章 大语言模型的技术细节 038~103
第一节 大语言模型的全局视图 040
第二节 注意力机制 049
一、自注意力机制 050
二、多头注意力机制 053
第三节 编码、嵌入和神经网络 057
一、位置编码 057
二、旋转位置编码 059
三、字段编码 062
四、前馈网络 064
五、层归一化 066
第四节 权重、参数和训练策略 068
一、权重 068
二、Transformer的训练策略和优化方法 070
三、Transformer模型的正则化技术 072
四、注意力机制的变种和改进 073
五、Transformer模型微调的常见策略 074
第五节 更多原理剖析 075
一、零样本提示 075
二、少量样本提示 076
三、Transformer模型中的残差连接 077
四、文本生成源码解读 078
第六节 大模型的能与不能 082
一、人工智能的大工业时代 083
二、ChatGPT不等于人工智能 084
第七节 图示Transformer和实战GPT-2 085
一、图示Transformer 085
二、实战GPT-2 096
第八节 实战:手动部署大模型 101
第三章 开源大模型和Llama实战 104~123
第一节 Llama的结构 106
第二节 运行Llama3 110
第三节 Llama微调 112
一、微调的步骤 112
二、微调的方法 114
三、微调所需的基础知识 119
第四节 实战:大语言模型(LLM)微调框架 121
第四章 中文Llama模型 124~167
第一节 中文数据准备 128
一、中文数据处理的技术 130
二、中文数据处理的过程 138
三、中文数据处理的工具 140
第二节 基于中文数据的模型训练 143
一、指令数据搜集和处理 143
二、AdaLoRA算法剖析 146
三、大模型指令微调之量化 147
四、大模型压缩技术 149
五、大模型蒸馏技术 150
第三节 模型评测 151
第四节 人类反馈的集成 156
第五节 实战:中文应用开发 159
一、基于Llama的医学大模型的开源项目 159
二、基于Llama的法律大模型的开源项目 161
三、基于Llama的金融大模型的开源项目 163
四、基于Llama的科技论文大模型的
开源项目 166
第五章 实战大语言模型应用 168~192
第一节 大模型的基础设施创新 169
一、数据库创新开源项目 169
二、将自然语言问题转换为 SQL 查询 171
三、将大模型数据查询SQL化 173
第二节 基于大模型的应用创新 174
一、基于LLM的开源代码编写助手 174
二、开源数据交互工具 176
三、领先的文档GPT开源项目 178
第三节 大模型的优化和发展创新 180
一、开源的大模型用户分析平台 180
二、低代码方式搭建大模型 181
三、开源搜索增强RAG项目 184
第四节 Agent技术 185
一、微软开源的强大Agent——AutoGen 186
二、让Agent去完成RPA 189
三、让Agent去标注数据——Adala 190
第六章 开源文生图 193~220
第一节 文生图技术概述 194
一、生成对抗网络(GANs)介绍 195
二、GANs在图片生成方面的应用 196
三、GANs图片应用的说明和原理 198
第二节 开源文生图模型介绍 202
一、Stable Diffusion介绍 203
二、LDMs介绍 208
三、DALL-E和Stable Diffusion 209
第三节 开源文生图模型技术要点 213
一、LDMs的源代码导读 213
二、用一个案例说明Stable Diffusion 214
三、实战:部署开源项目stable-diffusion-webui 218
第四节 实战:打造基于开源的文生图应用 220
第七章 开源文生视频 221~228
第一节 开源文生视频介绍 222
第二节 文生视频技术难点和路线 224
一、文生视频技术难点 224
二、开源文生视频路线 226
第三节 开源文生视频应用 227
第八章 开源多模态 229~240
第一节 多模态介绍 231
第二节 多模态的技术细节 232
一、GPT-4o的多模态介绍 234
二、视觉指令调整 235
第三节 开源多模态案例 235
一、LLaVA实现GPT-4V级别的开源多模态 235
二、开源LLaVA-1.5介绍 237
三、MGM:一个强大的多模态大模型 238
第九章 DeepSeek实战 241~253
第一节 DeepSeek核心技术介绍 242
一、混合专家架构 242
二、多头潜在注意力机制 244
三、混合精度训练 245
第二节 DeepSeek-R1模型复现 245
第三节 DeepSeek-V3本地化源码级部署 246
一、使用 DeepSeek-Infer 进行推理演示 247
二、基于华为硬件的DeepSeek部署 248
第四节 基于DeepSeek的开源应用 249
一、基于DeepSeek的PPT生成系统 249
二、DeepSeek支持的可视化BI解决方案 250
三、DeepSeek支持的健康分析平台 251
四、DeepSeek支持的智能测试用例生成平台 251
五、可本地化部署的企业级DeepSeek知识管理平台 252
六、基于DeepSeek的智能体RPA 252
內容試閱
OpenAI发布的ChatGPT轰动世界,来自中国的DeepSeek优化了大模型并开源,很多人把ChatGPT和DeepSeek出现的意义类比为人类有了电。自从有了电,工业革命进入第二次浪潮,电灯、洗衣机、冰箱、电脑等发明相继问世,彻底改变了人类生活方式。如今以ChatGPT为代表的大语言模型(Large Language Model,LLM)技术,正在开启智能时代的新篇章。可以预见,未来将涌现大量基于LLM的创新应用,LLM也将像电力一样成为社会发展的基础性资源。对于普通人来说,学习大语言模型的意义在于多个方面。
① 提升技术趋势认知:LLM代表了人工智能领域的最新发展。通过学习LLM,可以深入了解当前的技术趋势和未来发展,为个人职业规划或业务创新提供重要参考。
② 拓宽职业发展空间:随着LLM技术的快速发展和行业渗透,掌握相关技能将成为职场竞争力的重要组成部分。学习LLM技术不仅能为从业者创造新兴职业机会(如自然语言处理工程师、AI产品经理等),还能增强在传统行业数字化转型中的就业优势。
③ 提升个人技能:LLM技术可以帮助人们更高效地处理文本信息,提高写作、编辑、翻译等工作的效率和质量。这有助于提升个人技能,使人们在工作和生活中更加得心应手。
④ 培养创新思维:LLM技术具有广泛的应用前景,学习LLM可以激发创新思维,帮助人们发现新的应用场景和解决方案,推动技术进步和社会发展。
当然,从头学习人工智能需要投入大量的时间和精力,并且对数学和编程能力有一定的要求。这对于那些希望在工作中快速应用人工智能技术的人来说,可能是一个挑战。因此,借助开源项目进行实践,直接上手操作,是一个快速入门的有效途径。
本书意在通过介绍开源领域优秀的大模型和大模型应用,引导读者上手实际的应用场景和代码实现, 从而帮助读者更快地理解大模型技术原理及实际应用。这种方式类似于开汽车而不需要深入了解发动机原理,即学习者可以先掌握操作技巧,满足工作中的需要,然后再逐步深入了解背后的原理和技术细节。
然而,需要强调的是,虽然通过开源项目实践可以快速上手,但要想在人工智能领域取得长远的发展,仍然需要系统地学习相关知识和技能。只有深入理解人工智能的原理和方法,才能更好地应对复杂的问题和挑战,实现技术的创新和突破。
本书主要内容安排如下。
第一、二章详细介绍了Transformer的结构和GPT的结构,由于Transformer是经典的模型,建议读者深入阅读源代码。GPT-1和GPT-2是开源的项目,需要反复查看相关论文和源代码。
第三、四章介绍了Llama,这是目前比较流行的开源大模型,已经有很多行业基于Llama训练了行业大模型和垂类大模型。Llama的训练和微调方法大同小异,建议读者亲自做一遍,理解原理和掌握训练方法。
第五章介绍了大模型的应用,目前来看大模型的应用遍地开花,未来绝大多数的开发人员需要应用大模型的集成和交互。希望读者能够借鉴开源项目,培养产品思维,思考如何使用大模型,如何将自己的行业领域和大模型结合起来。
第六~八章介绍了文生图和文生视频以及多模态技术,由于注意力机制,大模型能很好地理解人类语言,这就让文生图、文生视频乃至多模态融合有了可能。这方面技术还不成熟,尤其是文生视频,但这恰恰也是目前最有机会的领域。一旦实现技术突破,就可能会再现OpenAI的奇迹。
第九章介绍了DeepSeek的技术创新和一些基于DeepSeek的开源项目。
本书的期望读者是有一定计算机科学基础但没有大模型基础,需要快速入门大模型的群体,希望本书成为一本实用的工具书。本书所述的开源项目都可以在开源社区获取,读者朋友可自行搜索和下载。
由于编者水平有限,如有疏漏,希望读者海涵。
编著者

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 台灣用户 | 香港/海外用户
megBook.com.tw
Copyright (C) 2013 - 2025 (香港)大書城有限公司 All Rights Reserved.