新書推薦:

《
无病到天年2 (全新修订版)大病预防先除湿
》
售價:NT$
347.0

《
大钱:如何选择成长股
》
售價:NT$
505.0

《
认知行为疗法:临床工作指南
》
售價:NT$
398.0

《
关系5.0
》
售價:NT$
612.0

《
翻篇是一种能力
》
售價:NT$
296.0

《
刘伯温与哪吒城:北京建城的传说
》
售價:NT$
449.0

《
文化的故事:从岩画艺术到韩国流行音乐(译林思想史)哈佛大学教授沉淀之作 获奖不断 全球热销 亲历文化史上的15个关键点 从史前艺术到当代韩流的人类文化全景
》
售價:NT$
398.0

《
不结婚的社会:双亲如何成为特权,以及家庭为何很重要
》
售價:NT$
296.0
|
內容簡介: |
数据科学是在动态世界中不断发展变化的。本书旨在让读者掌握数据科学基础知识与技能,尽快进入理论与实践,奠定进一步发展的基础。
本书精选了5章内容。第1章为数据初等描述;第2章介绍传统统计基本思维方式,可作为参考;第3章系统深入地介绍有监督学习基础,包括回归及分类概念方法,重点介绍决策树;第4章介绍机器学习组合算法及模型;第5章详细介绍神经网络的基本概念。内容聚焦于决策树、神经网络等既基础又具扩展功能的方法,未罗列扩展性不强的方法。
本书支持R和Python两种编程语言,R代码穿插于正文,Python代码及说明性R代码附于每章之后。建议读者在学习数据科学的过程中通过处理数据自学编程,培养自己的编程能力。
本书与教学契合度高,无论经验丰富的教师,还是没有机器学习和数理统计教学经验的教师,都能轻松上手。其独特的数据驱动教学方式,能够极大地激发学生的学习兴趣,促使学生快速吸收知识,提升学习效果。
|
關於作者: |
吴喜之 北京大学数学力学系本科毕业,北卡罗来纳大学统计学博士。中国人民大学统计学院教授,博士生导师.曾在南开大学、北京大学、加利福尼亚大学、北卡罗来纳大学等多所著名学府执教。
张 敏 重庆工商大学讲师。作为第一作者发表CSSCI、CSCD、SCI文章多篇,主持或参与国家级及省部级课题多项,作为第二作者出版关于数据科学的教材多部。
|
目錄:
|
第1章 体现真实世界的数据
1.1 数据: 对真实世界的记录
1.2 变量的逐个描述
1.3 变量关系的描述
1.4 数据的简单描述可能很肤浅甚至误导
1.5 习题
1.6 附录: 正文中没有的 R 代码
1.7 附录: 本章的Python代码
第2章 传统统计: 参数推断简介
2.1 关于总体均值 μ 的推断
2.2 关于伯努利试验概率的推断
2.3 习 题
2.4 附录: 本章的 Python 代码
第3章 有监督学习基础
3.1 引 言
3.2 简单回归模型初识
3.3 最小二乘线性回归模型
3.4 决策树回归
3.5 通过例子总结两种回归方法
3.6 简单分类模型初识
3.7 Logistic回归的数学背景
3.8 决策树分类的更多说明
3.9 通过例子对两种分类方法进行总结
3.10 多分类问题
3.11 习题
3.12 附录: 正文中没有的 R 代码
3.13 附录: 本章的 Python代码
第4章 机器学习组合算法
4.1 什么是组合算法
4.2 bagging
4.3 随机森林
4.4 梯度下降法及极端梯度增强回归
4.5 AdaBoost 分类
4.6 组合算法对两个数据的交叉验证
4.7 习题
4.8 附录: 正文中没有的R代码
4.9 附录: 本章的Python代码
第5章 神经网络
5.1 基本概念
5.2 通过基础编程了解神经网络的细节
5.3 习题
5.4 附录: 本章的Python代码
|
內容試閱:
|
第 1 章是关于数据的初等描述,这是初识真实数据所必需的。第2章介绍了传统统计的基本思维方式,这部分虽然和后续内容关系不大, 但由于是历史, 不应该回避, 可以仅作为参考或讨论。第3章介绍了有监督学习基础,包括建模、模型解释、模型预测、基于交叉验证的模型比较等内容, 系统深入地介绍了回归及分类的概念及方法。对于有监督学习载体的具体模型, 不但介绍了传统统计中最常用的最小二乘线性回归, 还从基本原理到编程全方位地介绍了作为机器学习中最重要的基础学习器之一的决策树, 为后面要引入的更精确的组合算法奠定了基础。第4章介绍了机器学习组合算法及若干重要的组合算法模型, 包括 bagging、随机森林、梯度增强回归和 AdaBoost。第5章详细地介绍了神经网络的基本概念, 神经网络是深度学习的基础, 理解神经网络对今后学习深度学习有很大的益处。
本书是一本基础教材, 因此在机器学习选题上选择决策树、神经网络等既基本又有扩展功能的方法, 而且从理论到编码进行了详尽的描述。为了使读者在短时间内集中精力牢固掌握最重要的有广泛意义的知识, 本书没有罗列一些常用但扩展性不强的方法, 比如支持向量机、贝叶斯网络等, 感兴趣的读者可以从其他渠道获得这些知识。
|
|