登入帳戶　 \|　訂單查詢　 \|　購物車/收銀台(0)　\|　在線留言板　 \|　付款方式　 \|　聯絡我們　 \|　運費計算　 \|　幫助中心　\|　加入書簽
		會員登入新用戶註冊

HOME

新書上架

暢銷書架

好書推介

2025年度TOP

香港／國際用戶

最新/最熱/最齊全的簡體書網

品種：超過100萬種書，正品正价，放心網購，悭钱省心

送貨：速遞 / 物流，時效：出貨後2-4日

『簡體書』R语言与数据挖掘最佳实践和经典案例（介绍了R用于数据挖掘应用的案例，涵盖了最常用的数据挖掘技术）

書城自編碼： 2460068
分類：簡體書→大陸圖書→計算機/網絡→數據庫
作者： Yanchang Zhao 著，陈健译
國際書號(ISBN)： 9787111475415
出版社：机械工业出版社
出版日期： 2014-09-01
版次： 1 印次： 1
頁數/字數： 208页
書度/開本： 16开釘裝：平装

售價：NT$ 441

我要買件

** 我創建的書架 **
未登入.

新書推薦：

《当战争来敲门（牛津二战史，耶鲁、剑桥大学教授推荐）》
售價：NT$ 449

《初老的身体：更年期新规则指南（第2版）》
售價：NT$ 653

《摘星星的人》
售價：NT$ 218

《名侦探的守则（东野圭吾：反套路！玩梗诡计，吐槽套路，爆笑推理！“你怎么看出我男扮女装的？”）》
售價：NT$ 301

《金融帝国：美元如何计算全球》
售價：NT$ 347

《全球化时代的历史书写：七位欧美历史学家访谈录尔文智识生活系列》
售價：NT$ 500

《好能量》
售價：NT$ 454

《心灵银行手账：创造真正改变的卓越系统世界级催眠大师约翰·卡帕斯博士上世纪90年代收费75万美金》
售價：NT$ 347

建議一齊購買：

NT$ 456
《数据挖掘与R语言（书中大量实际案例充分体现了R软件的广度和深》

NT$ 891
《R语言核心技术手册（第2版）》

NT$ 441
《R与Hadoop大数据分析实战（首部全面讲解R语言与Hado》

NT$ 504
《数据挖掘：R语言实战》

NT$ 573
《R数据分析——方法与案例详解（双色）》

NT$ 573
《机器学习与R语言（机器学习领域专家著作核心理论与实践案例结》

內容簡介：

本书为研究人员、高校学生、数据分析人员介绍了使用R语言进行数据挖掘应用的实用方法和技术。读者会从本书中发现使用R语言完成数据挖掘任务（如分类和预测、聚类、孤立点检测、关联规则、序列分析、文本挖掘、社会网络分析、情感分析等）的非常有价值的指导。数据挖掘技术在广泛领域都发展迅速。本书重点关注数据挖掘过程的建模阶段，以及数据探查和模型评估问题。本书讲述简洁实用，配有现实应用案例和代码示例以及数据，在线资源及时丰富，是一本数据分析的实战技术图书。

關於作者：

Yanchang
Zhao　从2009年起担任澳大利亚政府部门的高级数据挖掘分析师。在加入澳大利亚政府部门之前，他是悉尼科技大学工程和信息技术学院博士后研究员。他的研究兴趣包括聚类分析、关联规则、时间序列、孤立点检测、数据挖掘应用等，当前关注在数据挖掘应用中使用R语言。他是IEEE高级会员和澳大利亚分析专业人员协会成员。他发表了50多篇数据挖掘研究和应用方面的论文，并独立或与他人合作编写了3本著作。

目　录
R and Data Mining：Examples and Case Studies
出版者的话
译者序
缩写词表
第1章　简介1
1.1　数据挖掘1
1.2　R1
1.3　数据集2
1.3.1　iris数据集2
1.3.2　bodyfat数据集3
第2章　数据的导入与导出4
2.1　R数据的保存与加载4
2.2　.CSV文件的导入与导出4
2.3　从SAS中导入数据5
2.4　通过ODBC导入与导出数据6
2.4.1　从数据库中读取数据7
2.4.2　从Excel文件中导入与导出数据7
第3章　数据探索8
3.1　查看数据8
3.2　探索单个变量10
3.3　探索多个变量12
3.4　更多探索15
3.5　将图表保存到文件中19
第4章　决策树与随机森林21
4.1　使用party包构建决策树21
4.2　使用rpart包构建决策树24
4.3　随机森林29
第5章　回归分析33
5.1　线性回归33
5.2　逻辑回归38
5.3　广义线性回归38
5.4　非线性回归40
第6章　聚类41
6.1　k-means聚类41
6.2　k-medoids聚类43
6.3　层次聚类45
6.4　基于密度的聚类46
第7章　离群点检测50
7.1　单变量的离群点检测50
7.2　局部离群点因子检测53
7.3　用聚类方法进行离群点检测56
7.4　时间序列数据的离群点检测58
7.5　讨论59
第8章　时间序列分析与挖掘60
8.1　R中的时间序列数据60
8.2　时间序列分解60
8.3　时间序列预测62
8.4　时间序列聚类63
8.4.1　动态时间规整63
8.4.2　合成控制图的时间序列数据64
8.4.3　基于欧氏距离的层次聚类65
8.4.4　基于DTW距离的层次聚类66
8.5　时间序列分类67
8.5.1　基于原始数据的分类67
8.5.2　基于特征提取的分类68
8.5.3　k-NN分类69
8.6　讨论70
8.7　延伸阅读70
第9章　关联规则71
9.1　关联规则的基本概念71
9.2　Titanic数据集71
9.3　关联规则挖掘73
9.4　消除冗余78
9.5　解释规则79
9.6　关联规则的可视化80
9.7　讨论与延伸阅读82
第10章　文本挖掘84
10.1　Twitter的文本检索84
10.2　转换文本85
10.3　提取词干86
10.4　建立词项-文档矩阵88
10.5　频繁词项与关联90
10.6　词云91
10.7　词项聚类92
10.8　推文聚类94
10.8.1　基于k-means算法的推文聚类94
10.8.2　基于k-medoids算法的推文聚类96
10.9　程序包、延伸阅读与讨论98
第11章　社交网络分析99
11.1词项网络99
11.2推文网络102
11.3双模式网络107
11.4讨论与延伸阅读110
第12章　案例Ⅰ：房价指数的分析与预测111
12.1HPI数据导入111
12.2HPI数据探索112
12.3HPI趋势与季节性成分118
12.4HPI预测120
12.5房地产估价122
12.6讨论122
第13章　案例Ⅱ：客户回复预测与效益最大化123
13.1简介123
13.2KDD Cup 1998的数据123
13.3数据探索131
13.4训练决策树137
13.5模型评估140
13.6选择最优决策树143
13.7评分145
13.8讨论与总结148
第14章　案例Ⅲ：内存受限的大数据预测模型150
14.1简介150
14.2研究方法150
14.3数据与变量151
14.4随机森林152
14.5内存问题153
14.6样本数据的训练模型154
14.7使用已选变量建立模型156
14.8评分162
14.9输出规则168
14.9.1以文本格式输出规则168
14.9.2输出SAS规则的得分172
14.10总结与讨论177
第15章　在线资源178
15.1R参考文档178
15.2R178
15.3数据挖掘179
15.4R的数据挖掘180
15.5R的分类与预测181
15.6R的时间序列分析181
15.7R的关联规则挖掘181
15.8R的空间数据分析181
15.9R的文本挖掘182
15.10R的社交网络分析182
15.11R的数据清洗与转换182
15.12R的大数据与并行计算182
R语言数据挖掘参考文档184
参考资料197
通用索引201
包索引203
函数索引204

書城介紹　 \|　合作申請　\|　索要書目　 \|　新手入門　\|　聯絡方式　 \|　幫助中心　\|　找書說明　 \|　送貨方式　\|　付款方式	台灣用户　\|　香港/海外用户

megBook.com.tw
Copyright (C) 2013 - 2026 （香港）大書城有限公司　All Rights Reserved.