登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入 新註冊 | 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / EMS,時效:出貨後2-3日

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

2023年08月出版新書

2023年07月出版新書

2023年06月出版新書

2023年05月出版新書

2023年04月出版新書

2023年03月出版新書

2023年02月出版新書

『簡體書』机器学习基础 面向预测数据分析的算法 实用范例与案例研究

書城自編碼: 3496018
分類: 簡體書→大陸圖書→計算機/網絡人工智能
作 者: [爱尔兰] 约翰?,D.凯莱赫[John D.,Kelleh
國際書號(ISBN): 9787111652335
出版社: 机械工业出版社
出版日期: 2020-05-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 594

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
世界服饰艺术史
《 世界服饰艺术史 》

售價:NT$ 1445.0
海外中国研究·卿本著者:明清女性的性别身份、能动主体和文学书写
《 海外中国研究·卿本著者:明清女性的性别身份、能动主体和文学书写 》

售價:NT$ 381.0
日耳曼通识译丛:近代哲学:从笛卡尔到康德
《 日耳曼通识译丛:近代哲学:从笛卡尔到康德 》

售價:NT$ 150.0
我的灵魂是日落时分空无一人的旋转木马:聂鲁达诗精选
《 我的灵魂是日落时分空无一人的旋转木马:聂鲁达诗精选 》

售價:NT$ 381.0
春日喜你
《 春日喜你 》

售價:NT$ 257.0
我们八月见
《 我们八月见 》

售價:NT$ 215.0
东线炼狱 : 德国反坦克兵的东线日记 : 1941—1942
《 东线炼狱 : 德国反坦克兵的东线日记 : 1941—1942 》

售價:NT$ 439.0
献给皇帝的礼物:Wedgwood瓷器王国与漫长的十八世纪
《 献给皇帝的礼物:Wedgwood瓷器王国与漫长的十八世纪 》

售價:NT$ 594.0

內容簡介:
本书重点讲述用于预测性数据分析的*重要的机器学习方法,包括理论概念和实际应用。
目錄
译者序
前言
符号记法
第1章 面向预测数据分析的机器学习1
1.1 什么是预测数据分析1
1.2 什么是机器学习2
1.3 机器学习的工作原理4
1.4 机器学习会产生什么问题7
1.5 预测数据分析项目的生命周期:CRISP-DM9
1.6 预测数据分析工具10
1.7 本书概览11
1.8 习题12
第2章 数据到见解再到决策13
2.1 将商业问题转化为分析解决方案13
2.2 可行性评估14
2.3 设计分析基础表16
2.4 特征的设计与实现19
2.4.1 不同的数据类型20
2.4.2 不同的特征类型20
2.4.3 处理时间21
2.4.4 法律问题23
2.4.5 特征的实现25
2.4.6 案例研究:汽车保险诈骗25
2.5 总结28
2.6 延伸阅读28
2.7 习题29
第3章 数据探索31
3.1 数据质量报告31
3.2 了解数据35
3.2.1 正态分布37
3.2.2 案例研究:汽车保险诈骗38
3.3 找出数据质量问题39
3.3.1 缺失值39
3.3.2 异常基数40
3.3.3 离群点40
3.3.4 案例研究:汽车保险诈骗41
3.4 处理数据质量问题42
3.4.1 处理缺失值43
3.4.2 处理离群点43
3.4.3 案例研究:汽车保险诈骗44
3.5 高阶数据探索45
3.5.1 可视化特征之间的关系45
3.5.2 度量协方差和相关性52
3.6 数据准备56
3.6.1 归一化56
3.6.2 分箱57
3.6.3 采样60
3.7 总结61
3.8 延伸阅读62
3.9 习题62
第4章 基于信息的学习73
4.1 大思路73
4.2 基础知识75
4.2.1 决策树75
4.2.2 香农熵模型77
4.2.3 信息增益80
4.3 标准方法:ID3算法83
4.4 延伸与拓展89
4.4.1 其他特征选取与纯度度量方法89
4.4.2 处理连续描述性特征92
4.4.3 预测连续目标95
4.4.4 剪枝98
4.4.5 模型组合100
4.5 总结103
4.6 延伸阅读104
4.7 习题104
第5章 基于相似性的学习109
5.1 大思路109
5.2 基本概念110
5.2.1 特征空间110
5.2.2 用距离度量测量相似性111
5.3 标准方法:最近邻算法113
5.4 延伸与拓展116
5.4.1 处理嘈杂数据116
5.4.2 高效内存搜索118
5.4.3 数据归一化124
5.4.4 预测连续目标127
5.4.5 其他相似性测量129
5.4.6 特征选取136
5.5 总结141
5.6 延伸阅读143
5.7 后记144
5.8 习题144
第6章 基于概率的学习149
6.1 大思路149
6.2 基础知识151
6.2.1 贝叶斯定理152
6.2.2 贝叶斯预测154
6.2.3 条件独立与因子化157
6.3 标准方法:朴素贝叶斯模型160
6.4 延伸与拓展163
6.4.1 平滑163
6.4.2 连续特征:概率密度函数166
6.4.3 连续特征:分箱174
6.4.4 贝叶斯网络177
6.5 总结187
6.6 延伸阅读188
6.7 习题188
第7章 基于误差的学习192
7.1 大思路192
7.2 基础知识192
7.2.1 简单线性回归193
7.2.2 测量误差194
7.2.3 误差曲面196
7.3 标准方法:使用梯度下降法的多变量线性回归197
7.3.1 多变量线性回归198
7.3.2 梯度下降法198
7.3.3 选择学习率和初始权值203
7.3.4 实用范例204
7.4 延伸与拓展206
7.4.1 解释多变量线性回归模型206
7.4.2 用权值衰减设定学习率208
7.4.3 处理类别描述性特征209
7.4.4 处理类别目标特征:对数几率回归210
7.4.5 建模非线性关系219
7.4.6 多项对数几率回归223
7.4.7 支持向量机226
7.5 总结229
7.6 延伸阅读231
7.7 习题231
第8章 评估237
8.1 大思路237
8.2 基础知识238
8.3 标准方法:留出测试集上的误分类率238
8.4 延伸与拓展241
8.4.1 设计评估实验241
8.4.2 性能度量:类别目标246
8.4.3 性能度量:预测得分252
8.4.4 性能度量:多项目标264
8.4.5 性能度量:连续目标265
8.4.6 评估部署后的模型268
8.5 总结273
8.6 延伸阅读273
8.7 习题274
第9章 案例研究:客户流失278
9.1 商业理解278
9.2 数据理解280
9.3 数据准备283
9.4 建模286
9.5 评估289
9.6 部署290
第10章 案例研究:星系分类292
10.1 商业理解292
10.2 数据理解294
10.3 数据准备299
10.4 建模303
10.4.1 基准模型303
10.4.2 特征选取305
10.4.3 5级别模型306
10.5 评估307
10.6 部署308
第11章 面向预测数据分析的机器学习艺术309
11.1 预测模型的不同视角310
11.2 选择机器学习方法313
11.2.1 将机器学习方法和项目匹配315
11.2.2 将机器学习方法和数据匹配315
11.3 总结316
附录A 机器学习的描述性统计量与数据可视化317
附录B 机器学习的概率论导论326
附录C 机器学习中的求导方法332
参考文献336
索引343
內容試閱
本书的目的是呈现一个通俗易懂的、引导性的机器学习基础资料,并说明在实践中是如何利用机器学习解决商业、科学以及其他组织环境的预测数据分析问题的。因此,本书不仅讨论一般机器学习书籍所涵盖的内容,也讨论预测分析项目的生命周期、数据准备、特征设计和模型部署。
本书可作为计算机科学、自然与社会科学、工程以及商学专业本科生和研究生的机器学习、数据挖掘、数据分析或人工智能课程的教材。书中的案例研究展示了机器学习在工业领域的数据分析方面的应用,因此本书也可以作为从业者的参考材料,还可用作工业界的培训教材。
本书基于我们多年教授机器学习的经验编写而成,书中的方法和素材源于课堂,并经过了实践检验。在撰写本书的过程中,为使这些素材更易于理解,我们采用了如下指导原则:
将最重要且最常用的算法解释清楚,而不是笼统地囊括机器学习的所有方面。作为教师,我们认为让学生深入理解一个领域的核心和基础概念能够为他们打下坚实的基础,如此学生才能够独立地探索这个领域。这种见微知著的方法使我们能够用更多的篇幅去介绍、解释、阐明和情境化那些较为基础和实用的算法。
在从技术上正式地描述算法的原理之前,先通俗地解释算法的意图。对每个主题进行通俗的介绍,可以使学生在学习更为技术性的内容之前打下坚实的基础。我们针对本科生、研究生和专业人士等的教学经验表明,这些通俗的介绍能使学生轻松地理解主题。
提供完整的实用范例。在本书中,我们展示了所有范例的完整运作方式,这样能使读者检查自己的理解程度。
本书结构
在教授一个技术主题时,展示其实际应用是非常重要的。为此,我们在预测数据分析这一重要且处于成长期的工业界机器学习应用情境下展现机器学习。机器学习与数据分析的联系贯穿本书的每一章。在第1章中,介绍机器学习,并解释机器学习在标准的数据分析项目的生命周期中所扮演的角色。在第2章,呈现一个设计和构建预测分析解决方案的框架,该框架基于机器学习且能够满足商业需要。所有机器学习算法都假设存在一个可供训练的数据集。因此,第3章阐释在预先建好的预测模型上使用数据集前如何对数据集进行设计、构建和质量检查。
第4~7章是本书的主要机器学习章节,每一章都展示了不同的机器学习方法:第4章为通过搜集信息来学习;第5章为通过类比来学习;第6章为通过预测可能的结果来学习;第7章为通过搜索误差最小的解来学习。这些章节都分为如下两部分:
第一部分首先对该章内容进行通俗的介绍,紧接着详细地阐释理解这些内容所需的技术概念,然后展示使用该学习方法的一个标准机器学习算法以及详细的实用范例。
第二部分阐释该标准机器学习算法的各种拓展方法,以及所延伸出的著名的变种算法。
将这些章节分为两部分的目的在于自然地将该章内容分节。由此,一节课就可以涵盖每章的第一部分(大思路、基础知识、标准方法),即一个主题。接着——如果时间允许的话——课程的主题可以延伸至第二部分的全部或部分内容。第8章阐述如何评估预测模型的性能,并展示了一系列不同的评估指标。该章也由标准方法以及延伸与拓展这两部分组成。在所有技术章节中,更为广泛的预测分析场景持续地穿插于翔实、完整的实际范例中,并且给出了范例所基于的数据集和论文的引用来源。
第9和10章的案例研究(客户流失、星系分类)清晰地展现了广泛的商业情境与机器学习之间的联系,尤其强调许多超越建模的问题和任务(比如商业理解、问题定义、数据收集和准备,以及对见解进行交流)对预测分析项目的重要性。最后,第11章讨论机器学习中一系列基础性的话题,并强调了针对给定问题选择合适的机器学习方法不仅涉及关于模型精确度的因素,而且必须将模型的特性与商业需求进行匹配。
如何使用本书
多年的教学工作,使我们对适用于一学期的导论课程和适用于两学期的高阶课程所需的教学内容有了清晰的认识。为使本书适用于上述两种不同的教学情境,本书的内容是模块化的,各章之间没有太多依赖关系。因此,教师在使用本书时只需选择自己想要讲授的部分,而不需要担心这些部分之间的依赖关系。讲课时,第1、2、9~11章的内容通常需要2~3课时,而第3~8章的内容则通常需要4~6课时。
我们在表1中列出了针对不同情况的建议授课计划。所有课程都包含第1章(面向预测数据分析的机器学习)和第11章(面向预测数据分析的机器学习艺术)。列出的第一门课程M.L.(短,深入)设计为一学期机器学习课程,这门课程侧重于让学生深入理解两个机器学习方法,以及了解在评估一个机器学习模型时所应使用的正确方法。在建议的课程中,我们决定纳入全部第4章(基于信息的学习)的内容,以及第7章(基于误差的学习)的内容。但这些内容也可被第5章(基于相似性的学习)和或第6章(基于概率的学习)取代。M.L. (短,深入)也是短期(一周)专业人员培训的理想课程。第二门课程M.L.(短,广泛)则是另一种一学期机器学习课程,这门课程侧重于涵盖一系列机器学习方法,并且包括了详细的评估方法。对于长达两学期的机器学习课程M.L.(长)来说,我们建议讲授数据准备(3.6节)、所有的

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.