新書推薦:

《
中西交通史 陆海书系
》
售價:NT$
296.0

《
图说新质生产力1:科技创新 落地化解读新质生产力的内涵和精髓
》
售價:NT$
301.0

《
从弗洛伊德到百忧解:精神病学的历史(医学人文丛书)
》
售價:NT$
398.0

《
雪
》
售價:NT$
352.0

《
当代学术·中古中国与粟特文明
》
售價:NT$
653.0

《
财政与国家治理
》
售價:NT$
755.0

《
魏特琳日记(重新修订,震撼上市)
》
售價:NT$
449.0

《
国宝中的国宝:195件禁止出国展览文物
》
售價:NT$
1418.0
|
編輯推薦: |
1)资深高级工程师亲笔:一线大模型搜索项目经验,权威可信。 2)完整源码开源:随书附赠全流程代码,一键复刻,零门槛上手,全流程跑通。 3)从 0 到 1 指导:零基础也能独立构建专属 AI 搜索应用。 4)系统梳理原理:覆盖检索增强生成(RAG)、混合检索、向量化等核心技术。
|
內容簡介: |
本书基于大模型成功赋能AI搜索经验总结,系统梳理AI搜索的实现原理、核心技术、关键工具及模块化实现,带你从0到1搭建专属AI搜索应用,跑通全流程;配套全流程源码,降低开发门槛,轻松构建专属AI搜索应用。 本书共8章。第1章从多个维度分析大模型技术,帮助读者理解其技术变革与应用的本质,最后分析了大模型落地难点,让读者对大模型有全面认知。第2章梳理AI搜索从关键词匹配到语义理解的发展路径,并以LeptonSearch为例解析源码实现,帮读者构建AI搜索的初步认知框架。第3章全面解析查询理解、规划执行、答案内容优化以及答案缓存优化等AI搜索的关键技术,旨在帮助读者深入理解AI搜索系统的内部运作机制与实现。第4章介绍OpenAI API、DeepSeek、LangChain、Milvus等技术及其应用,帮助读者降低开发门槛。第5章讲解如何从零开始构建一个AI搜索系统的后端架构,涵盖后端技术方案设计、基础框架构建,为后续功能开发打好基础。第6章详解AI搜索系统的五大核心模块(实体、分析器、检索器、生成器、过滤器)的功能定位与代码实现,以构建一个结构清晰、职责分明的AI搜索引擎内核。第7章聚焦于系统的自动化调度设计,如动作类的定义与实现、调度器模块的构建,提升系统的智能化水平。第8章详解应用层(DAO操作层、Service逻辑层、Controller接口层)的开发流程,最后提供多个接口实现示例,并通过3个场景来测试AI搜索效果。
|
關於作者: |
吕思:服务端高级工程师。目前专注于大模型的应用落地与核心架构研发,助力业务成功实现大模型场景化应用和基于AI的数字化转型。曾就职于多家知名中大型互联网公司和上市企业,深耕互联网领域项目。多次荣获省级ACM等重要奖项,并热衷于开源,个人开源项目广受开发者社区认可,累计收获上千次关注(Star)。
|
目錄:
|
目 录前言第1章 大模型技术分析与落地难点 11.1 大模型技术分析 11.1.1 变革与挑战共存 11.1.2 与传统模型的区别 21.1.3 对行业格局的冲击 31.1.4 从训练流程看发展的限制因素 41.2 落地难点 5第2章 AI搜索历程与原理初探 72.1 AI搜索发展的历程 72.1.1 搜索的智能化趋势 72.1.2 AI如何赋能传统搜索 102.1.3 AI搜索的未来发展方向 102.2 AI搜索的原理初探:基于Lepton Search分析 122.2.1 为什么选择Lepton Search 122.2.2 Lepton Search后端源码分析 14第3章 深入AI搜索核心技术 233.1 查询理解技术 233.1.1 问题分类机制 233.1.2 查询改写机制 253.1.3 查询扩展机制 293.1.4 意图识别与规划 303.2 规划执行技术 343.2.1 动作的分类 343.2.2 调用仅输出动作 353.2.3 调用搜索并输出动作 363.2.4 基于Agent的执行过程 393.2.5 基于工作流的执行过程 423.3 答案内容优化技术 473.3.1 角色与答案模板机制 473.3.2 在答案中呈现引用编号 493.3.3 呈现不同维度的答案 503.4 答案缓存优化技术 553.4.1 缓存的核心考量 563.4.2 引入缓存后的问题 573.4.3 答案多样性的简单处理 603.4.4 答案多样性的高级处理 61第4章 掌握应用的开发技术栈 634.1 认识OpenAI API 634.1.1 API介绍 634.1.2 会话补全能力 654.1.3 嵌入模型能力 674.1.4 微调模型能力 684.2 掌握DeepSeek模型 704.2.1 核心技术 714.2.2 本地部署 734.2.3 基于Python调用 744.3 认识Milvus向量数据库 754.3.1 Milvus介绍 754.3.2 本地搭建Milvus 774.3.3 核心技术与原理 784.4 Milvus本地知识库实践 794.5 LangChain基础知识 874.5.1 核心组成与生态 874.5.2 创建提示词模板 884.5.3 创建模型 904.5.4 创建大模型链 914.6 精通LangChain的高级用法 934.6.1 回调函数的使用 934.6.2 聊天上下文管理 954.6.3 Agent与工具的调用 97第5章 后端方案设计与框架构建 1005.1 技术方案设计 1005.1.1 项目整体设计 1005.1.2 后端数据库设计 1015.1.3 后端流式通信设计 1035.2 构建后端基础框架 1065.2.1 划分后端目录结构 1065.2.2 开发项目入口文件 1075.2.3 开发服务初始化模块 108第6章 构建AI搜索的核心架构 1126.1 实体模块 1126.1.1 创建参数实体 1126.1.2 创建策略实体 1156.1.3 创建规划实体 1176.1.4 创建调度结果实体 1196.1.5 创建搜索结果实体 1206.2 分析器模块 1326.3 检索器模块 1426.4 生成器模块 1466.5 过滤器模块 1506.5.1 创建过滤器基类 1506.5.2 创建移除器模块 1516.5.3 创建重排序模块 1526.5.4 创建读取器模块 153第7章 实现AI搜索的自动运行 1577.1 创建动作类 1577.2 实现调度器模块 164第8章 开发AI搜索的应用功能与场景测试 1718.1 开发DAO操作层 1718.1.1 实现会话DAO操作 1718.1.2 实现消息的DAO操作 1758.1.3 实现引用DAO操作 1788.1.4 实现网页内容DAO操作 1808.2 开发Service逻辑层 1838.2.1 使用缓存中的答案的处理逻辑 1838.2.2 生成预测问题的处理逻辑 1868.3 开发Controller接口层 1888.3.1 统一接口注册 1888.3.2 开发请求中间件 1898.3.3 开发会话记录列表接口 1928.3.4 开发会话操作接口 1938.3.5 开发流式问答接口 1968.3.6 开发预测问题接口 1998.4 AI搜索应用场景测试 2018.4.1 私人问答方向 2018.4.2 写作创作方向 2038.4.3 学术研究方向 204
|
內容試閱:
|
前 言自2022年ChatGPT问世以来,大模型技术开启了人工智能应用的新纪元。这项突破性的技术不仅重塑了人机交互方式,还推动了各行业智能化转型的浪潮。然而,当技术从实验室走向真实场景时,我们逐渐认识到大模型在实时性、准确性和成本效益等方面的局限性。特别是在信息检索领域,传统大模型受限于静态训练数据,难以满足用户对时效性、精准性的需求。正是这些挑战,催生了AI(人工智能)搜索这一创新解决方案—它巧妙融合了大模型的语义理解能力与实时网络检索技术,正在重新定义信息获取的边界。为什么撰写本书在过去的20年中,搜索引擎经历了从基于关键词匹配的简单算法,到融合机器学习和语义理解的智能搜索系统的演变。然而,随着信息爆炸时代的到来,传统搜索系统逐渐暴露出诸多局限性:对用户意图的理解不够精准、无法有效处理复杂查询、结果呈现缺乏个性化和上下文关联等。这些痛点促使我们不断探索新的技术路径,以实现更高效、更智能的搜索。自2023年开始,大模型的爆发式发展为搜索领域带来了前所未有的变革契机。以GPT-4、LLaMA、DeepSeek为代表的模型不仅具备强大的自然语言生成能力,还展现出卓越的推理、规划和多轮对话能力。这些特性使得搜索系统不再局限于“关键词-文档”的匹配逻辑,而是能够理解用户的深层需求,提供更具洞察力的答案,并通过交互式的问答过程持续优化搜索结果。这种范式转变标志着搜索正从“被动响应”迈向“主动理解与引导”。正因为如此,AI搜索正在成为下一代信息获取的核心方式,它也是大模型技术在实际落地中最具代表性的应用场景之一。相比于传统搜索引擎,AI 搜索不仅能够更精准地理解用户意图,还能结合上下文信息提供连贯、智能的答案。这种能力显著提升了信息检索的精准度与用户体验,重新定义了搜索技术的边界。在传统搜索中,用户往往需要通过关键词匹配来获取信息,而AI 搜索则通过语义理解和上下文分析,让搜索过程更贴近用户需求,甚至能够主动补充信息、生成内容,展现出前所未有的智能化水平。然而,理论上的突破并不意味着落地应用的顺畅。尽管许多企业已经开始尝试将大模型引入搜索系统,但在实际部署过程中仍面临诸多挑战。例如,如何高效地将大模型集成到现有的搜索架构中?如何解决模型推理成本高、响应延迟大的问题?如何平衡搜索结果的准确性与多样性?此外,不同行业对搜索功能的需求差异显著,通用的大模型往往难以满足垂直领域的特定场景需求,因此需要结合微调、提示工程、向量检索等多种手段进行定制化开发。在这样的背景下,本书应运而生。本书从后端系统开发到提示词优化,从大模型的应用到向量存储,再到搜索引擎技术,覆盖AI 搜索的全栈技术体系。本书旨在深入解析AI 搜索的核心技术原理,并以循序渐进的方式带领读者搭建完整的AI 搜索应用。无论是开发者还是技术爱好者,都能通过本书系统学习AI 搜索的实现方法,掌握从零到一开发大模型应用的能力。本书特色聚焦AI搜索核心技术:本书围绕AI搜索的核心技术展开,包括查询理解、规划执行、答案生成与优化、缓存策略等关键技术,深入讲解每种技术的实现方式,帮助读者构建系统化的知识体系。结合大模型与工程实践:不同于市面上仅介绍大模型理论或传统搜索原理的书籍,本书将大模型与搜索系统深度融合,探讨如何利用大模型提升搜索质量,并结合LangChain、Milvus、OpenAI API等主流技术进行实战开发。提供完整项目架构与源码解析:本书不仅展示了一个完整的AI搜索系统架构,还详细分析了其后端代码结构,涵盖实体、分析器、检索器、生成器、过滤器等核心模块,使读者能够快速上手并进行二次开发。覆盖多个应用场景与测试用例:本书不仅关注技术实现,还提供了多个典型应用场景(如私人问答、写作创作、学术研究)的测试用例,帮助读者测试AI搜索在不同领域的落地成果。强调性能优化与工程落地难点:除了基础实现外,本书还重点讨论了缓存机制、流式通信、异步调度等优化策略,并分析企业在部署AI搜索系统时可能遇到的性能瓶颈与解决方案。读者对象本书适合以下几类读者群体阅读。AI工程师与搜索研发人员:希望了解大模型如何赋能搜索系统,并掌握相关技术栈(如LangChain、Milvus、OpenAI API)的实战技巧。创业者与中小企业的开发者:希望借助本书提供的开源框架与开发指南,快速搭建自己的AI搜索产品。高校学生与研究人员:希望系统学习AI搜索原理与最新进展,为后续研究打下坚实基础。对于上述各类读者而言,本书可以帮助你理解当前AI搜索的技术格局,掌握最新的开发工具与方法,并最终构建一个稳定、高效、可扩展的AI搜索系统。如何阅读本书第1章分析了大模型面临的变革与挑战,以及它与传统模型的区别、对行业格局的冲击,并通过剖析训练流程揭示当前大模型发展所面临的限制因素,帮助读者理解大模型技术变革与应用的本质。此外,本章还探讨了大模型的落地难点,让读者对大模型有全面认知。第2章系统梳理了AI搜索的发展脉络,从早期的关键词匹配到现代的语义理解,逐步揭示了AI搜索的必然演进路径,以及AI如何赋能搜索系统并推动其未来发展。同时,本章选取了Lepton Search作为典型案例,深入分析其后端架构与实现原理,为读者构建了AI搜索的初步认知框架。第3章全面解析了AI搜索的核心技术,涵盖查询理解、规划执行、答案内容优化以及答案缓存优化等,旨在帮助读者深入理解AI搜索系统的内部运作机制,全面掌握相关技术的应用与实现。第4章详细介绍AI搜索开发所涉及的主要技术栈,包括OpenAI API、DeepSeek模型、Milvus向量数据库、LangChain框架等。通过实例演示,指导读者如何配置环境、调用API、构建本地知识库,并掌握LangChain的高级用法。第5章进入系统设计阶段,讲解如何从零开始构建一个AI搜索系统的后端架构。内容涵盖技术方案设计、后端基础框架构建,为后续功能开发打好基础。第6章围绕AI搜索系统的五大核心模块(实体、分析器、检索器、生成器、过滤器)展开,详细说明每个模块的功能定位与代码实现,以构建一个结构清晰、职责分明的AI搜索引擎内核。第7章聚焦于AI搜索系统的自动化调度机制,介绍动作类的定义与实现,并构建调度器模块,确保搜索任务能够按照既定规则自动流转与执行,提升系统的智能化水平。第8章是AI搜索系统的应用功能实现与场景测试部分,详细讲解DAO操作层、Service逻辑层、Controller接口层的开发流程,并提供多个接口实现示例。最后通过私人问答、写作创作、学术研究场景的测试,验证整个系统的实现效果。勘误与支持虽然笔者尽最大努力确保内容准确无误,但难免存在疏漏。如果你在阅读过程中发现任何问题,欢迎通过wgraper@163.com邮箱与我联系。致谢撰写本书是一段充满挑战却又收获颇丰的旅程。在这一过程中,我深深感受到来自身边许多人的支持与鼓励。正是有了他们的支持与帮助,我才得以顺利完成这本书。在此,谨向所有给予我关心与支持的人致以最诚挚的感谢。我的妻子是我这段写作旅程中最坚定的支持者。她以无尽的耐心与关爱,陪伴我度过无数个伏案写作的日夜。在我专注于创作时,她默默承担了许多家庭琐事;在我遇到瓶颈、思路受阻时,她总能给予我鼓励与力量。她的理解与包容,让我能够心无旁骛地投入写作,完成这项艰巨的任务。其他家人的支持同样不可或缺。他们用无条件的关怀为我营造了一个温暖而稳定的环境,使我能全身心投入到书籍的创作之中。无论是生活上的照顾,还是精神上的鼓励,他们的陪伴始终给予我前行的动力和信心。在技术探索的过程中,我也得到了许多朋友的帮助。他们不仅提供了专业的建议,还参与了深入的讨论,让我受益匪浅。这些交流不仅丰富了书中的内容,也促使我对AI搜索技术有了更加全面、深刻的理解。读者的关注与支持,是我坚持创作的最大动力。大家的信任与期待给予了我无限的信心与热情。希望这本书能够为大家带来启发与帮助,愿我们在未来的技术探索之路上共同成长、一起进步。最后,再次感谢所有曾在这段旅程中给予我支持与鼓励的人。正是因为有大家的陪伴,这一切才如此有意义。
|
|