登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入   新用戶註冊
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2025年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / 物流,時效:出貨後2-4日

2026年01月出版新書

2025年12月出版新書

2025年11月出版新書

2025年10月出版新書

2025年09月出版新書

2025年08月出版新書

2025年07月出版新書

2025年06月出版新書

2025年05月出版新書

2025年04月出版新書

2025年03月出版新書

2025年02月出版新書

2025年01月出版新書

2024年12月出版新書

『簡體書』数据分析与数据挖掘

書城自編碼: 4176828
分類: 簡體書→大陸圖書→計算機/網絡數據庫
作者: 姜维
國際書號(ISBN): 9787121447433
出版社: 电子工业出版社
出版日期: 2024-12-01

頁數/字數: /

售價:NT$ 458

我要買

** 我創建的書架 **
未登入.



新書推薦:
从“四夷”到“外国”:《宋史·外国传》研究 国家社科基金后期资助项目
《 从“四夷”到“外国”:《宋史·外国传》研究 国家社科基金后期资助项目 》

售價:NT$ 449
苏格拉底的虔敬:读柏拉图《游叙弗伦》笔记
《 苏格拉底的虔敬:读柏拉图《游叙弗伦》笔记 》

售價:NT$ 403
思辨者的罗盘:从逻辑谬误到严谨表达
《 思辨者的罗盘:从逻辑谬误到严谨表达 》

售價:NT$ 286
面具之下:近代日本报人对华情报活动
《 面具之下:近代日本报人对华情报活动 》

售價:NT$ 449
广东省博物馆藏品大系 端砚卷
《 广东省博物馆藏品大系 端砚卷 》

售價:NT$ 2540
你的降落伞是什么颜色:就业市场不是一场录用游戏,而是一场淘汰游戏,直到准备充分的人胜出
《 你的降落伞是什么颜色:就业市场不是一场录用游戏,而是一场淘汰游戏,直到准备充分的人胜出 》

售價:NT$ 383
美国军事战略研究
《 美国军事战略研究 》

售價:NT$ 857
一对一沟通
《 一对一沟通 》

售價:NT$ 561

內容簡介:
本书重点讲述统计数据分析方法和数据挖掘技术,在大数据时代和人工智能时代,数据驱动的知识抽取技术成为一项重要学习和研究内容。本书采用理论和举例相结合的方式进行数据分析和数据挖掘知识讲解,并配套《数据分析与数据挖掘建模工具》一书,便于理论和实践相结合。书中内容包括统计检验、方差分析、回归分析、关联分析、分类模型、聚类模型、离群点分析等典型的数据分析和数据挖掘方法。
目錄
目 录

第1章 数据分析与数据挖掘基础1
1.1 数据分析与数据挖掘需求1
1.1.1 数据分析与数据挖掘1
1.1.2 大数据处理需求2
1.1.3 数据分析误区与隐私问题3
1.2 数据分析与数据挖掘的工作过程3
1.2.1 数据分析的主要工作过程3
1.2.2 数据收集5
1.2.3 数据展示6
1.3 数据的组织和数据的类型7
1.3.1 数据的一般组织形式7
1.3.2 数据类型8
1.3.3 分类数据的编码9
1.4 数据的常用描述性统计量11
1.4.1 数据的中心趋势11
1.4.2 数据的离散程度12
1.4.3 数据的形态统计量15
1.5 数据的基本描述性统计分析18
1.5.1 数据的描述性统计18
1.5.2 五数概括与盒图19
1.5.3 数据的描述性统计图20
1.6 本章小结22
本章概念与关键词22
练习与思考23
第2章 数据抽样与推断检验24
2.1 随机变量概率分布24
2.1.1 概率分布24
2.1.2 正态分布26
2.1.3 二项分布与泊松分布28
2.1.4 几何分布与超几何分布29
2.2 抽样统计分析31
2.2.1 抽样的相关概念31
2.2.2 概率抽样的典型方法33
2.2.3 非随机抽样的典型方法34
2.3 基本抽样分布34
2.3.1 经验分布、理论分布与抽样分布34
2.3.2 三大抽样分布36
2.3.3 小概率事件38
2.4 常用的抽样分布与区间估计40
2.4.1 常用的统计量抽样分布40
2.4.2 置信区间与区间估计42
2.5 常用的参数检验45
2.5.1 假设检验一般过程45
2.5.2 常用的参数检验统计量47
2.6 常用的单样本非参数检验48
2.6.1 卡方检验48
2.6.2 二项分布检验49
2.6.3 固定参数的超几何分布检验49
2.6.4 游程检验50
2.6.5 单样本K-S检验54
2.7 本章小结56
本章概念与关键词57
练习与思考57
第3章 可视化图与分组检验59
3.1 数据的常用可视化图分析59
3.1.1 数据的常用可视化图59
3.1.2 基于图的可视化观测一般过程62
3.2 均值比较和t检验62
3.2.1 分组统计62
3.2.2 数据标准化与Z-Score63
3.2.3 单样本t检验64
3.2.4 两独立样本t检验65
3.2.5 两配对样本t检验67
3.3 方差齐性检验68
3.3.1 Levene方差齐性检验68
3.3.2 基于F检验的方差齐性检验69
3.3.3 Brown-Forsythe方差齐性检验70
3.3.4 Bartlett’s方差齐性检验70
3.4 两独立样本的非参数检验71
3.4.1 Mann-Whitney U检验71
3.4.2 两独立样本K-S检验74
3.4.3 两独立样本游程检验76
3.4.4 两独立样本Moses极端反应检验77
3.4.5 两独立样本Brown-Mood中位数
检验78
3.5 两配对样本的非参数检验81
3.5.1 两配对样本符号检验81
3.5.2 中位数、分位数及比例的符号
检验82
3.5.3 两配对样本Wilcoxon符号秩
检验83
3.5.4 Wilcoxon符号秩单样本检验85
3.5.5 两配对样本McNemar检验86
3.5.6 边缘齐性检验88
3.6 多样本的非参数检验88
3.6.1 多独立样本中位数检验88
3.6.2 多独立样本Kruskal-Wallis检验90
3.6.3 多独立样本Jonckheere-Terpstra
检验91
3.6.4 多配对样本Friedman检验94
3.6.5 多配对样本Kendall协同系数
检验96
3.6.6 多配对样本Cochran’s Q检验97
3.7 本章小结98
本章概念与关键词99
练习与思考99
第4章 方差分析与相关性分析102
4.1 方差分析102
4.1.1 方差分析中的变量102
4.1.2 单因素方差分析103
4.1.3 单因素方差Brown-Forsythe
检验105
4.1.4 单因素方差Welch’s t检验106
4.1.5 无交互作用的双因素方差分析107
4.1.6 有交互作用的双因素方差分析109
4.2 Post Hoc检验111
4.2.1 LSD检验111
4.2.2 Studentized极差分布112
4.2.3 Tukey’s Range检验113
4.2.4 Tukey-Kramer检验115
4.2.5 SNK检验117
4.2.6 其他几种常用检验方法118
4.3 连续属性数据的相关性分析119
4.3.1 协方差的线性相关性度量119
4.3.2 相关系数的线性相关性度量122
4.3.3 Spearman秩相关系数124
4.4 离散属性相关性分析126
4.4.1 交叉列联表分析126
4.4.2 用卡方检验进行离散相关性分析127
4.4.3 列联表上常用的指标128
4.4.4 Fisher’s exact检验129
4.5 本章小结131
本章概念与关键词132
练习与思考132
第5章 数据的预处理与距离分析134
5.1 数据的预处理134
5.1.1 数据清理134
5.1.2 数据集成136
5.1.3 数据变换137
5.1.4 数据归约137
5.2 数据的常用组织方式138
5.2.1 数据的常用逻辑组织138
5.2.2 数据的常用物理组织139
5.2.3 高精度计算与矩阵计算139
5.2.4 编程语言、软件工具140
5.3 相似度计算与距离分析140
5.3.1 相似度与距离的转换140
5.3.2 闵可夫斯基距离143
5.3.3 马氏距离145
5.3.4 混合属性的相似度与距离147
5.4 kNN分类模型148
5.4.1 kNN分类模型概述148
5.4.2 距离加权kNN分类模型150
5.5 参数的点估计151
5.5.1 原点矩与中心矩151
5.5.2 矩估计法152
5.5.3 极大似然估计法153
5.6 本章小结156
本章概念与关键词156
练习与思考156
第6章 回归分析158
6.1 一元线性回归158
6.1.1 一元线性回归问题描述158
6.1.2 一元线性回归模型与求解159
6.1.3 确认回归方程的精度161
6.1.4 总体回归的方差分析162
6.1.5 残差分析164
6.1.6 回归方程参数检验167
6.1.7 回归方程预测与控制168
6.2 多元线性回归170
6.2.1 多元线性回归问题描述170
6.2.2 多元线性回归模型与求解172
6.2.3 确认回归方程的精度173
6.2.4 残差分析174
6.2.5 回归方程参数检验175
6.2.6 回归方程预测176
6.3 常用的曲线回归177
6.3.1 曲线回归问题177
6.3.2 多项式回归177
6.3.3 指数回归与对数回归179
6.3.4 其他常见曲线回归179
6.4 最小二乘法及其应用179
6.4.1 最小二乘法线性拟合179
6.4.2 伪逆矩阵求解180
6.4.3 Moore-Pseudo逆矩阵181
6.4.4 最小均方误差算法182
6.4.5 非线性回归183
6.4.6 智能优化求解技术183
6.5 Logistic回归184
6.5.1 Logistic回归分类与基本函数184
6.5.2 Logistic回归系数计算185
6.6 本章小结186
本章概念与关键词187
练习与思考187
第7章 空间降维技术189
7.1 主成分分析189
7.1.1 主成分分析描述189
7.1.2 基于协方差矩阵的主成分分析190
7.1.3 基于相关系数矩阵的主成分
分析192
7.1.4 主成分分析与因子分析的联系193
7.1.5 主成分分析的作用194
7.2 因子分析案例研究196
7.2.1 研究的目的与内容196
7.2.2 变量选取与数据来源196
7.2.3 因子分析过程197
7.2.4 因子回归分析198
7.2.5 案例研究结论199
7.3 奇异值分解200
7.3.1 SVD的协同过滤推荐200
7.3.2 SVD在协同过滤中的应用203
7.3.3 SVD增量式协同过滤方法204
7.4 主成分回归与逐步回归205
7.4.1 多重共线性205
7.4.2 主成分回归207
7.4.3 逐步回归207
7.5 本章小结208
本章概念与关键词208
练习与思考209
第8章 关联规则与点对相关性210
8.1 频繁模式与关联规则的基本
概念210
8.1.1 频繁模式的基本概念210
8.1.2 关联规则的基本概念211
8.1.3 极大频繁模式与闭频繁模式212
8.2 频繁模式挖掘213
8.2.1 Apriori算法213
8.2.2 垂直数据格式214
8.2.3 基于频繁模式计算关联规则215
8.3 频繁模式树216
8.3.1 频繁模式树的构建216
8.3.2 频繁模式树的递归过程219
8.4 点对相似度的典型度量220
8.4.1 点对关系常见度量220
8.4.2 点对相关性度量的几种特性222
8.5 信息熵及其应用与点对相关性
度量224
8.5.1 信息熵224
8.5.2 联合熵与互信息226
8.5.3 信息增益、相对熵和交叉熵228
8.5.4 互信息、交叉熵用于相关性229
8.6 本章小结230
本章概念与关键词230
练习与思考231
第9章 决策树232
9.1 分类问题与模型训练232
9.1.1 分类问题描述232
9.1.2 分类问题举例与泛化问题233
9.1.3 分类模型的常见评价指标235
9.2 决策树及ID3算法236
9.2.1 决策树概述236
9.2.2 ID3算法238
9.3 C4.5算法与连续属性特征分
类树241
9.3.1 C4.5算法241
9.3.2 连续属性的决策树构建241
9.4 CART决策树243
9.4.1 CART分类树243
9.4.2 CART回归树244
9.5 决策树剪枝250
9.5.1 剪枝问题的提出与先剪枝技术250
9.5.2 错误率降低剪枝法251
9.5.3 悲观剪枝法251
9.5.4 代价复杂度剪枝法254
9.6 ROC曲线与AUC指标255
9.6.1 ROC曲线描述与绘制255
9.6.2 ROC曲线绘制与作用257
9.6.3 AUC指标与应用258
9.7 本章小结259
本章概念与关键词259
练习与思考260
第10章 贝叶斯分类261
10.1 连续属性贝叶斯分类器261
10.1.1 单个1

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 台灣用户 | 香港/海外用户
megBook.com.tw
Copyright (C) 2013 - 2026 (香港)大書城有限公司 All Rights Reserved.