新書推薦:
《
他惯会装乖
》
售價:NT$
245.0
《
从大繁荣到大萧条 1919—1939年美国社会生活史
》
售價:NT$
500.0
《
中西交通史 陆海书系
》
售價:NT$
296.0
《
图说新质生产力1:科技创新 落地化解读新质生产力的内涵和精髓
》
售價:NT$
301.0
《
从弗洛伊德到百忧解:精神病学的历史(医学人文丛书)
》
售價:NT$
398.0
《
雪
》
售價:NT$
352.0
《
当代学术·中古中国与粟特文明
》
售價:NT$
653.0
《
财政与国家治理
》
售價:NT$
755.0
編輯推薦:
·统计学入门佳作
·助力零基础跨越编程与统计门槛的指南
·一本将 Python 与统计学巧妙融合的趣书
·简洁明了的文字与精妙实用的代码示例
·作者精心雕琢,打造多维度知识讲解体系
·呈现统计学从基础到前沿模型的完整脉络
內容簡介:
本书是统计学的入门书,对同一个知识点分别使用文字说明、数学式和Python示例代码进行讲解,循序渐进地介绍了统计学和Python的基础知识、描述统计、统计推断、假设检验、正态线性模型和广义线性模型等统计模型,以及机器学习等。通过阅读本书,读者不仅可以深刻理解统计学术语、统计分析方法和预测方法等,还可以学到前沿的机器学习知识,以及如何使用Python实现数据可视化和建模等。
本书结构清晰、直观易懂,适合统计学和Python的初学者及对数据科学和机器学习感兴趣的读者使用,也可作为高等院校计算机、统计等专业学生的入门书。
關於作者:
[日]马场真哉:出生于日本兵库县,2014年毕业于北海道大学水产科学院。分享统计学基础与应用、数据分析和Python编程等知识的网站Logics of Blue的管理者。著有《用R学编程和数据分析》《用R和Stan入门数据分析:基于贝叶斯统计建模》《时序分析和状态空间模型基础:用R和Stan学习理论和实现》《从均值和方差入门广义线性模型》《决策分析与预测的应用:从基础理论到Python实现》等。
目錄 :
目 录
第 1章 开始学习统计学1
1-1 统计学2
1-1-1 描述统计2
1-1-2 统计推断3
1-2 描述统计的必要性4
1-2-1 为什么需要描述统计4
1-2-2 均值存在的问题4
1-2-3 使用均值以外的指标5
1-2-4 数据可视化5
1-3 统计推断的必要性6
1-3-1 为什么需要统计推断6
1-3-2 术语 总体与样本6
1-3-3 术语 样本容量7
1-3-4 推断的形象描述7
1-3-5 样本的随机偏差与区间估计8
1-3-6 判断与假设检验8
1-3-7 模型与推断8
1-3-8 从线性模型到机器学习9
第 2章 Python与Jupyter Notebook基础11
2-1 环境搭建12
2-1-1 术语 Python12
2-1-2 术语 Anaconda12
2-1-3 术语 Jupyter Notebook13
2-1-4 安装Anaconda13
2-1-5 安装早期版本的Anaconda13
2-1-6 术语 Python编程术语14
2-2 认识Jupyter Notebook15
2-2-1 启动Jupyter Notebook15
2-2-2 创建新文件16
2-2-3 执行代码17
2-2-4 保存执行结果17
2-2-5 使用Markdown功能18
2-2-6 退出Jupyter Notebook19
2-2-7 使用Anaconda Prompt19
2-3 Python编程基础21
2-3-1 实现 四则运算21
2-3-2 实现 其他运算22
2-3-3 实现 注释22
2-3-4 实现 数据类型23
2-3-5 实现 比较运算25
2-3-6 实现 变量25
2-3-7 实现 函数27
2-3-8 实现 常用的函数28
2-3-9 实现 类与实例30
2-3-10 实现 基于if语句的程序分支32
2-3-11 实现 基于for语句的循环33
2-3-12 编写易用程序的技巧33
2-4 认识numpy与pandas35
2-4-1 实现 导入外部功能35
2-4-2 术语 numpy与pandas36
2-4-3 实现 列表36
2-4-4 实现 行与列36
2-4-5 实现 数组37
2-4-6 实现 数组的运算38
2-4-7 实现 二维数组38
2-4-8 实现 生成等差数列的方法39
2-4-9 实现 各类数组的生成40
2-4-10 实现 切片41
2-4-11 实现 数据帧43
2-4-12 实现 读取文件中的数据44
2-4-13 实现 连接数据帧45
2-4-14 实现 取出指定的列46
2-4-15 实现 取出指定的行47
2-4-16 实现 序列49
2-4-17 实现 函数文档50
第3章 描述统计51
3-1 数据的种类52
3-1-1 术语 观察、变量52
3-1-2 术语 定量数据、分类数据53
3-1-3 术语 离散型数据、连续型数据53
3-1-4 术语 二值数据、多值数据53
3-1-5 术语 名义尺度、顺序尺度、间距尺度、比例尺度54
3-1-6 术语 单变量数据、多变量数据55
3-1-7 术语 时间序列数据、横截面数据55
3-2 读懂数学式56
3-2-1 数学式作为表达方式56
3-2-2 用数学式表示样本56
3-2-3 为什么要使用数学式57
3-2-4 加法与Σ符号58
3-2-5 用数学式表示样本均值58
3-2-6 乘法与Π符号59
3-3 频数分布60
3-3-1 为什么要学习多种统计方法60
3-3-2 术语 频数、频数分布61
3-3-3 术语 组、组中值61
3-3-4 实现 环境准备61
3-3-5 实现 频数分布62
3-3-6 术语 频率分布、累积频数分布、累积频率分布65
3-3-7 实现 频率分布、累积频数分布、累积频率分布65
3-3-8 术语 直方图67
3-3-9 用于绘图的matplotlib、seaborn67
3-3-10 实现 直方图68
3-3-11 实现 组的大小不同的直方图69
3-3-12 术语 核密度估计70
3-3-13 实现 核密度估计72
3-4 单变量数据的统计量75
3-4-1 实现 环境准备75
3-4-2 准备实验数据75
3-4-3 实现 样本容量77
3-4-4 实现 总和77
3-4-5 实现 样本均值78
3-4-6 术语 样本方差79
3-4-7 实现 样本方差81
3-4-8 术语 无偏方差82
3-4-9 实现 无偏方差83
3-4-10 术语 标准差84
3-4-11 实现 标准差85
3-4-12 术语 变异系数85
3-4-13 实现 变异系数86
3-4-14 术语 标准化87
3-4-15 实现 标准化88
3-4-16 术语 最小值、最大值、中位数、四分位数89
3-4-17 实现 最小值、最大值89
3-4-18 实现 中位数90
3-4-19 实现 四分位数91
3-4-20 实现 众数92
3-4-21 实现 pandas的describe函数93
3-5 多变量数据的统计量94
3-5-1 实现 环境准备94
3-5-2 实现 准备用于实验的数据94
3-5-3 术语 协方差95
3-5-4 术语 协方差矩阵96
3-5-5 实现 协方差96
3-5-6 实现 协方差矩阵97
3-5-7 术语 皮尔逊积矩相关系数98
3-5-8 术语 相关矩阵98
3-5-9 实现 皮尔逊积矩相关系数99
3-5-10 相关系数无效的情况99
3-5-11 术语 列联表100
3-5-12 实现 列联表100
3-6 分层分析103
3-6-1 术语 分层分析103
3-6-2 术语 整洁数据103
3-6-3 术语 杂乱数据104
3-6-4 杂乱数据的例子105
3-6-5 实现 环境准备106
3-6-6 实现 读取实验数据106
3-6-7 实现 分组计算统计量107
3-6-8 实现 企鹅数据108
3-6-9 实现 企鹅数据的分层分析109
3-6-10 实现 缺失数据的处理110
3-6-11 实现 简单直方图112
3-6-12 实现 分组直方图113
3-7 使用图形114
3-7-1 实现 环境准备114
3-7-2 术语 matplotlib、seaborn114
3-7-3 实现 读取实验数据115
3-7-4 实现 散点图117
3-7-5 实现 图形的装饰和保存117
3-7-6 实现 折线图119
3-7-7 实现 条形图119
3-7-8 实现 箱形图120
3-7-9 实现 小提琴图121
3-7-10 术语 轴级函数与图级函数122
3-7-11 实现 基于种类和性别的小提琴图124
3-7-12 实现 基于种类、岛名和性别的小提琴图125
3-7-13 实现 散点图矩阵126
第4章 概率论与概率分布127
4-1 什么是概率论128
4-1-1 为什么要学习概率论128
4-1-2 第4章的内容脉络129
4-1-3 术语 集合130
4-1-4 术语 元素130
4-1-5 术语 集合的外延表示与内涵表示130
4-1-6 术语 子集130
4-1-7 术语 维恩图131
4-1-8 术语 交集与并集131
4-1-9 术语 差集132
4-1-10 术语 空集132
4-1-11 术语 全集133
4-1-12 术语 补集133
4-1-13 术语 样本点、样本空间、事件133
4-1-14 术语 互斥事件134
4-1-15 通过掷骰子联想到的各种概率135
4-1-16 术语 概率的公理化定义135
4-1-17 用频率解释概率135
4-1-18 主观概率学派136
4-1-19 术语 概率的加法定理137
4-1-20 术语 条件概率137
4-1-21 术语 概率的乘法定理138
4-1-22 术语 独立事件139
4-2 什么是概率分布140
4-2-1 术语 随机变量与样本值140
4-2-2 术语 离散随机变量与连续随机变量141
4-2-3 术语 概率分布141
4-2-4 术语 概率质量函数141
4-2-5 术语 均匀分布(离散型)143
4-2-6 术语 概率密度144
4-2-7 术语 概率密度函数144
4-2-8 概率的总和与概率密度积分的联系145
4-2-9 术语 均匀分布(连续型)147
4-2-10 术语 累积分布函数147
4-2-11 均匀分布的累积分布函数148
4-2-12 术语 百分位数148
4-2-13 术语 期望值149
4-2-14 术语 随机变量的方差151
4-2-15 均匀分布的期望值与方差152
4-2-16 术语 多元概率分布153
4-2-17 术语 联合概率分布154
4-2-18 术语 边缘化、边缘分布154
4-2-19 术语 条件概率分布155
4-2-20 术语 随机变量的独立155
4-2-21 二元概率分布的例子156
4-2-22 术语 随机变量的协方差与相关系数157
4-2-23 术语 独立同分布157
4-3 二项分布159
4-3-1 术语 试验159
4-3-2 术语 二值随机变量159
4-3-3 术语 伯努利试验160
4-3-4 术语 成功概率160
4-3-5 术语 伯努利分布160
4-3-6 设计程序来模拟抽签161
4-3-7 实现 环境准备161
4-3-8 实现 抽1张便笺的模拟161
4-3-9 实现 抽10张便笺的模拟163
4-3-10 实现 抽10张便笺并重复10 000 次的模拟165
4-3-11 术语 二项分布167
4-3-12 实现 二项分布168
4-3-13 实现 生成服从二项分布的随机数171
4-3-14 实现 二项分布的期望值与方差172
4-3-15 实现 二项分布的累积分布函数173
4-3-16 实现 二项分布的百分位数174
4-3-17 实现 二项分布的右侧概率175
4-4 正态分布176
4-4-1 实现 环境准备176
4-4-2 术语 正态分布176
4-4-3 实现 正态分布的概率密度函数177
4-4-4 正态分布的由来180
4-4-5 实现 误差累积的模拟180
4-4-6 术语 中心极限定理183
4-4-7 正态分布的性质184
4-4-8 实现 生成服从正态分布的随机数185
4-4-9 实现 正态分布的累积分布函数185
4-4-10 实现 正态分布的百分位数186
4-4-11 实现 正态分布的右侧概率186
第5章 统计推断187
5-1 统计推断的思路188
5-1-1 术语 抽样188
5-1-2 术语 简单随机抽样188
5-1-3 湖中钓鱼示例189
5-1-4 样本与随机变量189
5-1-5 作为抽样过程的总体分布190
5-1-6 用术语来描述抽样过程191
5-1-7 模型的应用191
5-1-8 术语 瓮模型192
5-1-9 把抽样过程抽象化的模型192
5-1-10 总体分布与总体的频率分布193
5-1-11 更现实的湖中钓鱼示例194
5-1-12 做假设194
5-1-13 假设总体服从正态分布195
5-1-14 术语 概率分布的参数195
5-1-15 术语 参数模型与非参数模型195
5-1-16 术语 统计推断196
5-1-17 假设总体分布是正态分布之后的做法196
5-1-18 小结:统计推断的思路196
5-1-19 从5-2节开始的解说流程197
5-1-20 所做的假设是否恰当197
5-2 用Python模拟抽样199
5-2-1 实现 环境准备199
5-2-2 抽样过程199
5-2-3 实现 在只有5条鱼的湖中抽样200
5-2-4 实现 从鱼较多的湖中抽样201
5-2-5 实现 总体分布的可视化202
5-2-6 实现 对比总体分布和正态分布的概率密度函数203
5-2-7 实现 抽样过程的抽象描述205
5-2-8 补充讨论206
5-2-9 假设总体服从正态分布是否恰当206
5-3 估计总体均值208
5-3-1 实现 环境准备208
5-3-2 术语 总体均值、总体方差、总体标准差208
5-3-3 术语 估计量、估计值209
5-3-4 样本均值作为总体均值的估计量209
5-3-5 模拟的内容209
5-3-6 实现 载入总体数据210
5-3-7 实现 计算样本均值210
5-3-8 实现 多次计算样本均值211
5-3-9 实现 样本均值的均值212
5-3-10 术语 无偏性、无偏估计量212
5-3-11 样本均值作为总体均值的无偏估计量213
5-3-12 实现 编写一个多次计算样本均值的函数214
5-3-13 实现 不同样本容量的样本均值的分布215
5-3-14 计算样本均值的标准差217
5-3-15 术语 标准误差219
5-3-16 实现 样本容量更大时的样本均值220
5-3-17 术语 一致性、一致估计量222
5-3-18 术语 大数定律222
5-3-19 统计推断的思考模式223
5-4 估计总体方差224
5-4-1 实现 环境准备224
5-4-2 实现 准备一个总体224
5-4-3 用样本方差、无偏方差估计总体方差225
5-4-4 实现 计算样本方差和无偏方差225
5-4-5 实现 样本方差的均值226
5-4-6 实现 无偏方差的均值227
5-4-7 无偏方差用作总体方差的无偏估计量227
5-4-8 实现 样本容量更大时的无偏方差229
5-5 从正态总体衍生的概率分布231
5-5-1 实现 环境准备231
5-5-2 术语 样本分布232
5-5-3 正态分布的应用232
5-5-4 术语 分布232
5-5-5 实现 模拟准备233
5-5-6 实现 分布234
5-5-7 样本均值服从的分布236
5-5-8 实现 样本均值的标准化237
5-5-9 术语 t值239
5-5-10 术语 t分布239
5-5-11 实现 t分布240
5-5-12 术语 F分布242
5-5-13 实现 F分布243
5-6 区间估计246
5-6-1 实现 环境准备246
5-6-2 术语 点估计、区间估计247
5-6-3 实现 点估计247
5-6-4 术语 置信水平、置信区间248
5-6-5 术语 置信界限248
5-6-6 总体均值的区间估计248
5-6-7 实现 总体均值的区间估计249
5-6-8 决定置信区间大小的因素251
5-6-9 区间估计结果的解读252
5-6-10 总体方差的区间估计254
5-6-11 实现 总体方差的区间估计255
第6章 假设检验257
6-1 单样本t检验258
6-1-1 假设检验入门258
6-1-2 关于总体均值的单样本t检验258
6-1-3 术语 零假设与备择假设259
6-1-4 术语 显著性差异259
6-1-5 t检验的直观解释260
6-1-6 均值差异大不代表存在显著性差异261
6-1-7 术语 检验统计量261
6-1-8 回顾t值261
6-1-9 小结1262
6-1-10 术语 第 一类错误与第二类错误263
6-1-11 术语 显著性水平263
6-1-12 术语 拒绝域与接受域263
6-1-13 术语 p值264
6-1-14 小结2264
6-1-15 回顾t值与t分布的关系265
6-1-16 术语 单侧检验与双侧检验265
6-1-17 计算拒绝域266
6-1-18 计算p值267
6-1-19 本节涉及的数学式268
6-1-20 实现 环境准备269
6-1-21 实现 计算t值270
6-1-22 实现 计算拒绝域271
6-1-23 实现 计算p值271
6-1-24 实现 通过模拟计算p值272
6-2 均值差检验274
6-2-1 双样本t检验274
6-2-2 配对样本t检验274
6-2-3 实现 环境准备275
6-2-4 实现 配对样本t检验276
6-2-5 独立样本t检验(异方差)277
6-2-6 实现 独立样本t检验(异方差)278
6-2-7 独立样本t检验(同方差)279
6-2-8 术语 p值操纵279
6-3 列联表检验281
6-3-1 使用列联表的优点281
6-3-2 本节示例282
6-3-3 计算期望频数283
6-3-4 计算观测频数和期望频数的差异283
6-3-5 实现 环境准备284
6-3-6 实现 计算p值284
6-3-7 实现 列联表检验285
6-4 检验结果的解读287
6-4-1 p值小于或等于0.05时的表述方法287
6-4-2 p值大于0.05时的表述方法287
6-4-3 假设检验的常见误区288
6-4-4 p值小不代表差异大288
6-4-5 p值大于0.05不代表没有差异289
6-4-6 术语 假设检验的非对称性289
6-4-7 在检验之前确定显著性水平289
6-4-8 是否有必要学习假设检验290
6-4-9 是否满足前提条件290
第7章 统计模型基础291
7-1 统计模型292
7-1-1 术语 模型292
7-1-2 术语 建模292
7-1-3 模型的作用292
7-1-4 从正态总体中随机抽样的模型292
7-1-5 术语 数学模型293
7-1-6 术语 概率模型294
7-1-7 模型的估计294
7-1-8 模型的升级295
7-1-9 基于模型的预测295
7-1-10 简化复杂的世界295
7-1-11 从某个角度观察复杂的现象296
7-1-12 统计模型与经典数据分析的对比296
7-1-13 统计模型的应用297
7-2 建立线性模型的方法298
7-2-1 本节示例298
7-2-2 术语 响应变量与解释变量298
7-2-3 术语 线性模型299
7-2-4 术语 系数与权重300
7-2-5 如何建立线性模型300
7-2-6 线性模型的选择301
7-2-7 术语 变量选择301
7-2-8 术语 空模型302
7-2-9 通过假设检验选择变量302
7-2-10 通过信息量准则选择变量302
7-2-11 模型评估303
7-2-12 在建模之前确定分析目的303
7-3 数据表示与模型名称304
7-3-1 从广义线性模型的角度对模型进行分类304
7-3-2 术语 正态线性模型304
7-3-3 术语 回归分析305
7-3-4 术语 多元回归分析305
7-3-5 术语 方差分析305
7-3-6 术语 协方差分析305
7-3-7 机器学习中的术语306
7-4 参数估计:最大化似然307
7-4-1 为什么要学习参数估计307
7-4-2 术语 似然307
7-4-3 术语 似然函数308
7-4-4 术语 对数似然308
7-4-5 对数的性质309
7-4-6 术语 最大似然法311
7-4-7 术语 最大似然估计量311
7-4-8 术语 最大对数似然311
7-4-9 服从正态分布的数据的似然312
7-4-10 术语 多余参数312
7-4-11 正态线性模型的似然312
7-4-12 最大似然法计算示例314
7-4-13 最大似然估计量的性质315
7-5 参数估计:最小化损失316
7-5-1 术语 损失函数316
7-5-2 术语 拟合值与预测值316
7-5-3 术语 残差317
7-5-4 为什么不能将残差之和直接作为损失指标317
7-5-5 术语 残差平方和318
7-5-6 术语 最小二乘法319
7-5-7 最小二乘法与最大似然法的关系319
7-5-8 术语 误差函数320
7-5-9 多种损失函数320
7-6 预测精度的评估与变量选择321
7-6-1 术语 拟合精度与预测精度321
7-6-2 术语 过拟合321
7-6-3 变量选择的意义321
7-6-4 术语 泛化误差322
7-6-5 术语 训练集与测试集322
7-6-6 术语 交叉验证322
7-6-7 术语 赤池信息量准则323
7-6-8 术语 相对熵323
7-6-9 相对熵的最小化与平均对数似然324
7-6-10 AIC与平均对数似然中的偏差325
7-6-11 使用AIC进行变量选择325
7-6-12 用变量选择代替假设检验325
7-6-13 应该使用假设检验还是AIC326
第8章 正态线性模型327
8-1 含有单个连续型解释变量的模型(一元回归)328
8-1-1 实现 环境准备328
8-1-2 实现 读入数据并绘制其图形329
8-1-3 建模330
8-1-4 使用最小二乘法估计系数330
8-1-5 实现 估计系数332
8-1-6 估计出的系数的期望值与方差333
8-1-7 实现 使用statsmodels建模334
8-1-8 实现 打印估计结果并检验系数335
8-1-9 实现 summary函数的输出336
8-1-10 实现 使用AIC进行模型选择337
8-1-11 实现 使用一元回归进行预测339
8-1-12 实现 置信区间和预测区间340
8-1-13 术语 回归直线341
8-1-14 实现 使用seaborn绘制回归直线342
8-1-15 实现 绘制置信区间和预测区间343
8-1-16 回归直线的方差344
8-2 正态线性模型的评估346
8-2-1 实现 环境准备346
8-2-2 实现 获取残差347
8-2-3 术语 决定系数348
8-2-4 实现 决定系数348
8-2-5 术语 修正决定系数351
8-2-6 实现 修正决定系数351
8-2-7 实现 残差的可视化352
8-2-8 术语 分位图353
8-2-9 实现 分位图353
8-2-10 实现 对照summary函数的输出结果分析残差355
8-3 方差分析357
8-3-1 本节示例357
8-3-2 什么时候应该使用方差分析357
8-3-3 术语 多重假设检验358
8-3-4 方差分析的直观理解:F比358
8-3-5 显著性差异与小提琴图359
8-3-6 方差分析的直观理解:分离效应和误差360
8-3-7 术语 组间差异与组内差异361
8-3-8 实现 环境准备361
8-3-9 实现 生成数据并可视化362
8-3-10 实现 计算各水平均值与总体均值363
8-3-11 实现 方差分析①:计算组间偏差平方和与组内偏差平方和364
8-3-12 实现 方差分析②:计算组间方差与组内方差366
8-3-13 实现 方差分析③:计算F比和p值367
8-3-14 单因素方差分析的计算过程367
8-3-15 术语 平方和分解369
8-3-16 解释变量为分类变量的正态线性模型370
8-3-17 术语 虚拟变量370
8-3-18 实现 statsmodels中的方差分析371
8-3-19 术语 方差分析表371
8-3-20 模型系数的含义372
8-3-21 实现 使用模型分离效应和误差372
8-3-22 实现 回归模型中的方差分析373
8-4 含有多个解释变量的模型377
8-4-1 实现 环境准备377
8-4-2 实现 错误的分析:只比较均值378
8-4-3 术语 协变量380
8-4-4 实现 比较回归直线的截距380
8-4-5 实现 使用普通的方差分析进行检验383
8-4-6 实现 多个解释变量的平方和计算384
8-4-7 术语 调整平方和386
8-4-8 实现 Type II检验386
8-4-9 实现 读入新数据388
8-4-10 术语 交互作用388
8-4-11 实现 错误的分析:模型中未包含交互作用388
8-4-12 实现 建立包含交互作用的模型390
8-4-13 实现 Type III检验390
8-4-14 实现 使用AIC进行变量选择392
8-4-15 实现 交互作用项的含义393
8-4-16 实现 formula参数的功能396
8-4-17 实现 设计矩阵398
第9章 广义线性模型401
9-1 广义线性模型概述402
9-1-1 广义线性模型的组成402
9-1-2 本书使用的概率分布402
9-1-3 术语 泊松分布403
9-1-4 术语 指数型分布族403
9-1-5 指数型分布族常用的概率分布404
9-1-6 术语 线性预测算子404
9-1-7 术语 联系函数405
9-1-8 联系函数与概率分布的关系406
9-1-9 广义线性模型的参数估计406
9-1-10 广义线性模型的检验方法406
9-2 逻辑斯谛回归408
9-2-1 术语 逻辑斯谛回归408
9-2-2 本节示例408
9-2-3 二值分类问题408
9-2-4 术语 logit函数409
9-2-5 术语 反函数409
9-2-6 术语 logistic函数409
9-2-7 logistic函数的性质410
9-2-8 逻辑斯谛回归的推导410
9-2-9 逻辑斯谛回归的似然函数411
9-2-10 实现 环境准备412
9-2-11 实现 读入数据并可视化412
9-2-12 实现 逻辑斯谛回归414
9-2-13 实现 逻辑斯谛回归的结果414
9-2-14 实现 逻辑斯谛回归的模型选择415
9-2-15 实现 使用逻辑斯谛回归进行预测416
9-2-16 实现 逻辑斯谛回归的回归曲线417
9-2-17 术语 优势和对数优势418
9-2-18 术语 优势比和对数优势比419
9-2-19 实现 逻辑斯谛回归的系数与优势比的关系419
9-3 广义线性模型的评估421
9-3-1 实现 环境准备421
9-3-2 术语 皮尔逊残差422
9-3-3 实现 皮尔逊残差423
9-3-4 术语 偏差424
9-3-5 术语 偏差残差425
9-3-6 实现 偏差残差425
9-3-7 术语 交叉熵误差427
9-4 泊松回归429
9-4-1 泊松分布429
9-4-2 泊松分布与二项分布的关系429
9-4-3 实现 环境准备430
9-4-4 实现 泊松分布431
9-4-5 术语 泊松回归433
9-4-6 本节示例433
9-4-7 泊松回归的推导433
9-4-8 实现 读入数据434
9-4-9 实现 泊松回归434
9-4-10 实现 泊松回归的模型选择435
9-4-11 实现 使用泊松回归进行预测436
9-4-12 实现 泊松回归的回归曲线437
9-4-13 实现 回归系数的含义437
第 10章 统计学与机器学习439
10-1 机器学习基础440
10-1-1 术语 机器学习440
10-1-2 术语 监督学习440
10-1-3 术语 无监督学习440
10-1-4 术语 强化学习441
10-1-5 术语 基于规则的机器学习441
10-1-6 统计学与机器学习无法彻底分离441
10-1-7 统计学注重过程,机器学习注重结果441
10-2 正则化、Ridge回归与Lasso回归443
10-2-1 术语 正则化443
10-2-2 术语 Ridge回归443
10-2-3 术语 Lasso回归444
10-2-4 确定正则化强度445
10-2-5 将解释变量标准化445
10-2-6 Ridge回归与Lasso回归的差异445
10-2-7 变量选择与正则化的对比446
10-2-8 正则化的意义447
10-3 Python中的Ridge回归与Lasso回归448
10-3-1 术语 scikit-learn448
10-3-2 实现 环境准备448
10-3-3 实现 解释变量的标准化450
10-3-4 实现 定义响应变量451
10-3-5 实现 普通最小二乘法452
10-3-6 实现 使用sklearn实现线性回归453
10-3-7 实现 Ridge回归:惩罚指标的影响453
10-3-8 实现 Ridge回归:确定最佳正则化强度456
10-3-9 实现 Lasso回归:惩罚指标的影响457
10-3-10 实现 Lasso回归:确定最佳正则化强度458
10-3-11 实现 使用Lasso回归进行预测459
10-4 线性模型与神经网络461
10-4-1 术语 输入向量、目标向量、权重、偏置461
10-4-2 术语 单层感知机461
10-4-3 术语 激活函数462
10-4-4 从线性模型到神经网络463
10-4-5 术语 隐藏层463
10-4-6 术语 神经网络464
10-4-7 神经网络的结构464
10-4-8 神经网络中的L2正则化465
10-4-9 实现 环境准备465
10-4-10 实现 一元回归分析466
10-4-11 实现 使用神经网络实现回归468
10-4-12 实现 逻辑斯谛回归471
10-4-13 实现 使用神经网络实现分类474
10-4-14 实现 生成用于复杂分类问题的数据476
10-4-15 实现 将数据分割为训练集与测试集477
10-4-16 实现 对复杂数据进行逻辑斯谛回归分析478
10-4-17 实现 使用神经网络对复杂数据进行分类478
10-4-18 线性模型与神经网络各自的优点479
参考文献(图灵社区下载)