新書推薦:
《
别怕,试一试
》
售價:NT$
307.0
《
人才基因(凝聚30年人才培育经验与智慧)
》
售價:NT$
468.0
《
深度学习详解
》
售價:NT$
519.0
《
李白传(20世纪文史学家李长之经典传记)
》
售價:NT$
207.0
《
津轻:日本无赖派文学代表太宰治自传性随笔集
》
售價:NT$
302.0
《
河流之齿
》
售價:NT$
270.0
《
新经济史革命:计量学派与新制度学派
》
售價:NT$
406.0
《
盗墓笔记之秦岭神树4
》
售價:NT$
259.0
|
內容簡介: |
数据主导的学习方式有助于读者理解数据科学的本质,读者可以通过分析数据学会多种统计方法的应用。本书以数据形式为导向,对应不同的数据形式介绍可能使用的一些统计方法。这些统计方法可能属于不同的模型和统计方向,但只要适用于同一类数据,本书就尽量都予以介绍,以此启发读者探索及创新。
本书初版以来,在广大读者的支持和鼓励下,10年间不断更新。第4版在第3版的基础上做了增补及修正,并且重新安排了部分章节。本书始终坚持以下特色:
(1)用实际数据做案例,这些数据都是真实的,有理论及应用方面的背景,而且能从网上下载。
(2)书中所有结论都可以通过Python与R软件程序得出,并给出所有例子的代码。
(3)没有太多数学公式,但能让读者直观理解各种方法的含义。
(4)宗旨是训练处理不同数据的动手能力,而不是面面俱到地告知所有细节。
本书适合用作统计学、应用统计学、经济学、数学、应用数学、精算、环境、计量经济学、生物医学等专业本科生、硕士生及博士生的教材,也可作为各领域的实际工作者的参考用书。
|
關於作者: |
吴喜之 北京大学数学力学系本科毕业,北卡罗来纳大学统计学博士。中国人民大学统计学院教授,博士生导师。曾在南开大学、北京大学、加利福尼亚大学、北卡罗来纳大学等多所著名学府执教。
张 敏 云南财经大学统计学博士,现就职于重庆工商大学。以第一作者公开发表了CSSCI/CSCD/SCI多篇文章,主持或参与国家及省部级课题多项,以第二作者出版关于数据科学的教材多部。
|
目錄:
|
第1章 引 言
第一部分 经典统计篇
第2章经典线性模型
第3章广义线性模型方法
第4章纵向数据 (多水平模型、面板数据)
第5章多元时间序列
第6章路径建模/结构方程建模
第7章无监督学习: 经典多元分析
第二部分 机器学习篇
第8章决策树及组合算法
第9章神经网络简介
第10章支持向量机及最近邻方法
第11章关联规则分析
第12章贝叶斯网络
第三部分 软件基础篇
第13章基本软件: R和Python
参考文献
|
內容試閱:
|
什么是复杂数据? 没有人能够确切定义. 本书将标准统计教科书中没有标明出处的或者是按照传统方法能够得到 “ 完美结论 ” 的数据称为简单数据. 现实世界中遇到的绝大多数数据都不是标准教科书中所介绍的方法能够圆满处理的, 因此可以认为是复杂数据. 在本书第 1 版问世后的 10 年间, 人们可处理的数据范围增大了很多倍. 本书中的数据是使用个人电脑所能够处理的结构化数据.对于实际工作者来说, 拿到一个真实数据以后, 很可能需要查阅不少文献来寻找适合这个数据的可能模型 (假定知道用什么模型可能解决问题), 再翻阅若干种软件手册来查阅这些文献所使用软件的计算方法 (假定下载了相应的免费 (开源) 软件或购买了相应的 (商业软件). 造成这种情况的原因是, 很多统计教科书是以数学模型或方法为导向的, 书名及内容也多是按照模型驱动的数学思维展开的.以模型或方法为导向的教科书通常以介绍某种数学模型和方法为主, 同时说明这种模型适用于满足某些数学假定的数据, 最后说明该模型对于这些满足假定的数据拟合的优越性. 实际上, 任何一种真实数据是否满足某种数学假定完全无法证明, 每一类数据都可能有不止一种现成的统计方法来处理, 还有无数的未知方法等待人们去开发. 以模型或方法为主导的方式往往让读者忽略了其他有关的方法, 而那些被忽略的方法在某种意义上很可能更有效, 或者更优越.
|
|