新書推薦:

《
中国早期城市与文明起源 一部中国早期城市发展简史,解读城市与文明交织共生的规律
》
售價:NT$
449

《
只要我还在创作 角谷美智子访谈录
》
售價:NT$
347

《
国医大师邓铁涛 治未病从孩子抓起 中医治未病 二十四节气顺时调养 常见病预防 中医健康体检 广东科技
》
售價:NT$
255

《
英国都铎王朝君主形象塑造与政治文化变迁
》
售價:NT$
857

《
从一道高三数学模拟测试题的背景谈起:兼谈等周问题与等周不等式
》
售價:NT$
347

《
《仪礼》版本研究:全三册
》
售價:NT$
1780

《
水浒传绘本 全8册 水浒桥梁书 同步原著改编去暴力 萌趣卡通国风画卷 文史科普趣味拓展
》
售價:NT$
1061

《
中国清代戏曲史上、下卷(套装2册)
》
售價:NT$
2030
|
| 編輯推薦: |
Data Mining with R:Learning with Case Studies
数据挖掘正在改变着企业和其他大型组织与客户的互动方式,同时也改变着它们管理复杂过程的方式。大量的数据正在很好地用于预测客户行为和结果。在软件方面,R以其强大的功能和诱人的价格(免费)正在改变着定量分析的“生态系统”。
本书的目的是引领读者迅速地进入这两个世界。本书以实际案例的方式介绍数据挖掘和R软件,这样读者就可以在真实情境中进行学习,而不会迷失在统计理论的细节讨论或者计算机科学的基础概念中。本书中用到的工具全部是免费的:MySQL数据库(用于数据库操作)和R软件(用于分析)。因此,本书教给你的是如何动手的知识。通过学习本书,你将体验到数据挖掘和R的强大功能。如果你能安装这些工具,并通过应用这些工具来详细地学习书中的案例研究,你将收获颇丰。本书逐步地通过案例研究来介绍R的概念,如果你还不熟悉R或者MySQL,你可以按章节顺序来学习这些案例。
本书的原作者Luís
Torgo,根据他在葡萄牙波尔图大学丰富的教学经验、在其他国家讲授数据挖掘课程的经验,以及聚集了世界各地专业人士的S
|
| 內容簡介: |
本书首先简要介绍了R软件的基础知识(安装、R数据结构、R编程、R的输入和输出等)。然后通过四个数据挖掘的实际案例(藻类频率的预测、证券趋势预测和交易系统仿真、交易欺诈预测、微阵列数据分类)介绍数据挖掘技术。这四个案例基本覆盖了常见的数据挖掘技术,从无监督的数据挖掘技术、有监督的数据挖掘技术到半监督的数据挖掘技术。全书以实际问题、解决方案和对解决方案的讨论为主线来组织内容,脉络清晰,并且各章自成体系。读者可以从头至尾逐章学习,也可以根据自己的需要进行学习,找到自己实际问题的解决方案。
本书不需要读者具备R和数据挖掘的基础知识。不管是R初学者,还是熟练的R用户都能从书中找到对自己有用的内容。读者既可以把本书作为学习如何应用R的一本优秀教材,也可以作为数据挖掘的工具书。
Data Mining with R:Learning with Case Studies by Luís TorgoISBN
978?1?4398?1018?7.
Copyright ?2011 by Taylor and Francis Group, LLC.
Authorized translation from the English language edition published
by CRC Press, part of Taylor Francis Group LLC; All rights
reserved.
China Machine Press is authorized to publish and
distribute exclusively the Chinese Simplified Characters language
edition?This edition is authorized for sale in the People?s
Republic of China only excluding Hong Kong, Macao SAR and
Taiwan.No part of this publication may be reproduced or
distributed in any form or by any means, or stored in a database or
retrieval system, without the prior written permission of the
publisher.
Copies of this book sold without a Taylor Francis sticker on
the cover are unauthorized and illegal.
|
| 目錄:
|
出版者的话
推荐序
中文版序
译者序
前言
致谢
第1章 简介
1.1如何阅读本书
1.2R简介
1.2.1R起步
1.2.2R对象
1.2.3向量
1.2.4向量化
1.2.5因子
1.2.6生成序列
1.2.7数据子集
1.2.8矩阵和数组
1.2.9列表
1.2.10数据框
1.2.11构建新函数
1.2.12对象、类和方法
1.2.13管理R会话
1.3MySQL简介
第2章 预测海藻数量
2.1问题描述与目标
2.2数据说明
2.3数据加载到R
2.4数据可视化和摘要
2.5数据缺失
2.5.1将缺失部分剔除
2.5.2用最高频率值来填补缺失值
2.5.3通过变量的相关关系来填补缺失值
2.5.4通过探索案例之间的相似性来填补缺失值
2.6获取预测模型
2.6.1多元线性回归
2.6.2回归树
2.7模型的评价和选择
2.8预测7类海藻的频率
2.9小结
第3章 预测股票市场收益
3.1问题描述与目标
3.2可用的数据
3.2.1在R中处理与时间有关的数据
3.2.2从CSV文件读取数据
3.2.3从网站上获取数据
3.2.4从MySQL数据库读取数据
3.3定义预测任务
3.3.1预测什么
3.3.2预测变量是什么
3.3.3预测任务
3.3.4模型评价准则
3.4预测模型
3.4.1如何应用训练集数据来建模
3.4.2建模工具
3.5从预测到实践
3.5.1如何应用预测模型
3.5.2与交易相关的评价准则
3.5.3模型集成:仿真交易
3.6模型评价和选择
3.6.1蒙特卡罗估计
3.6.2实验比较
3.6.3结果分析
3.7交易系统
3.7.1评估最终测试数据
3.7.2在线交易系统
3.8小结
第4章 侦测欺诈交易
4.1问题描述与目标
4.2可用的数据
4.2.1加载数据至R
4.2.2探索数据集
4.2.3数据问题
4.3定义数据挖掘任务
4.3.1问题的不同解决方法
4.3.2评价准则
4.3.3实验方法
4.4计算离群值的排序
4.4.1无监督方法
4.4.2有监督方法
4.4.3半监督方法
4.5小结
第5章 微阵列样本分类
5.1问题描述与目标
5.1.1微阵列实验背景简介
5.1.2数据集ALL
5.2可用的数据
5.3基因(特征)选择
5.3.1基于分布特征的简单过滤方法
5.3.2ANOVA过滤
5.3.3用随机森林进行过滤
5.3.4用特征聚类的组合进行过滤
5.4遗传学异常的预测
5.4.1定义预测任务
5.4.2模型评价标准
5.4.3实验过程
5.4.4建模技术
5.4.5模型比较
5.5小结
参考文献
主题索引
数据挖掘术语索引
R函数索引
|
|