登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入 新註冊 | 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / EMS,時效:出貨後2-3日

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

2023年08月出版新書

2023年07月出版新書

2023年06月出版新書

2023年05月出版新書

2023年04月出版新書

2023年03月出版新書

2023年02月出版新書

『簡體書』Python大数据分析算法与实例

書城自編碼: 3505390
分類: 簡體書→大陸圖書
作 者: 邓立国
國際書號(ISBN): 9787302551065
出版社: 清华大学出版社
出版日期: 2020-05-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 414

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
生活观察图鉴 中国常见鸟类观察图鉴
《 生活观察图鉴 中国常见鸟类观察图鉴 》

售價:NT$ 839.0
悠游人间 赛博朋克少女插画绘制教程
《 悠游人间 赛博朋克少女插画绘制教程 》

售價:NT$ 559.0
“李晓鹏说中华史”系列(全二册。中国人民大学经济学博士李晓鹏全新解读,经济学思维+战略史观,透视汉、唐、明、清的盛世兴衰)
《 “李晓鹏说中华史”系列(全二册。中国人民大学经济学博士李晓鹏全新解读,经济学思维+战略史观,透视汉、唐、明、清的盛世兴衰) 》

售價:NT$ 818.0
绿色剧变:能源大革命与世界新秩序
《 绿色剧变:能源大革命与世界新秩序 》

售價:NT$ 386.0
你的韧性超乎你的想象
《 你的韧性超乎你的想象 》

售價:NT$ 335.0
理想国译丛030:资本之都:21世纪德里的美好与野蛮
《 理想国译丛030:资本之都:21世纪德里的美好与野蛮 》

售價:NT$ 571.0
沙盘游戏疗法
《 沙盘游戏疗法 》

售價:NT$ 498.0
图坦卡蒙和改变世界的陵墓
《 图坦卡蒙和改变世界的陵墓 》

售價:NT$ 447.0

編輯推薦:
本书基于Python 3大数据分析方法中的核心算法与实例,重点介绍数据特征算法分析及第三方开源库的场景应用,包括NumPy、SciPy、Matplotlib、Pandas、StatsModels、Gensim等在大数据分析中的算法与实例。
內容簡介:
大数据时代,大数据分析是关键技术。Python是一款优秀的大数据分析软件,本书以Python 3结合第三方开源工具进行大数据分析,以*小的代价编程实现数据的提取、处理、分析和可视化。 本书分为8章,首先介绍大数据分析的背景和行业应用,给出了数据特征算法分析;然后基于Python 3介绍常用典型第三方大数据分析工具的场景应用;*后比较翔实地阐述大数据分析算法与经典实例应用。 本书适合从事大数据分析的研究人员、计算机或数学等相关专业的从业者参考学习,也可以作为计算机或数学等专业本科高年级或研究生的专业用书。
關於作者:
邓立国,东北大学计算机应用博士毕业。2005年开始在沈阳师范大学软件学院、教育技术学院任教,主要研究方向:数据挖掘、知识工程、大数据处理、云计算、分布式计算等。以第一作者发表学术论文30多篇(26篇EI),主编教材 1 部,主持科研课题6项,经费10余万元,多次获得校级科研优秀奖,作为九三社员提出的智慧城市提案被市政府采纳,研究成果被教育厅等单位采用。
目錄
目 录
第1章 大数据分析概述 1
1.1 大数据分析背景 1
1.2 大数据分析的应用 2
1.3 大数据分析算法 3
1.4 大数据分析工具 6
1.5 本章小结 9
第2章 数据特征算法分析 10
2.1 数据分布性分析 10
2.1.1 数据分布特征集中趋势的测定 10
2.1.2 数据分布特征离散程度的测定 15
2.1.3 数据分布特征偏态与峰度的测定 19
2.2 数据相关性分析 21
2.2.1 数据相关关系 21
2.2.2 数据相关分析的主要内容 24
2.2.3 相关关系的测定 24
2.3 数据聚类性分析 26
2.3.1 聚类分析定义 26
2.3.2 聚类类型 27
2.3.3 聚类应用 29
2.4 数据主成分分析 29
2.4.1 主成分分析的原理及模型 30
2.4.2 数据主成分分析的几何解释 31
2.4.3 数据主成分的导出 32
2.4.4 证明主成分的方差是依次递减的 34
2.4.5 数据主成分分析的计算 35
2.5 数据动态性分析 36
2.6 数据可视化 40
2.7 本章小结 42
第3章 大数据分析工具:NumPy 43
3.1 NumPy简介 43
3.2 NumPy环境安装配置 44
3.3 ndarray对象 45
3.4 数据类型 47
3.5 数组属性 49
3.6 数组创建例程 52
3.7 切片和索引 57
3.8 广播 60
3.9 数组操作与迭代 61
3.10 位操作与字符串函数 87
3.11 数学运算函数 91
3.12 算数运算 93
3.13 统计函数 97
3.14 排序、搜索和计数函数 101
3.15 字节交换 104
3.16 副本和视图 105
3.17 矩阵库 107
3.18 线性代数模块 109
3.19 Matplotlib库 112
3.20 Matplotlib 绘制直方图 114
3.21 IO文件操作 116
3.22 NumPy实例:GPS定位 117
3.23 本章小结 120
第4章 大数据分析工具:SciPy 121
4.1 SciPy简介 121
4.2 文件输入和输出:SciPy.io 122
4.3 特殊函数:SciPy.special 123
4.4 线性代数操作:SciPy.linalg 124
4.5 快速傅里叶变换:sipy.fftpack 124
4.6 优化器:SciPy.optimize 125
4.7 统计工具:SciPy.stats 126
4.8 SciPy实例 127
4.8.1 最小二乘拟合 127
4.8.2 函数最小值 128
4.9 本章小结 130
第5章 大数据分析工具:Matplotlib 131
5.1 初级绘制 131
5.2 图像、子区、子图、刻度 137
5.3 其他种类的绘图 140
5.4 本章小结 147
第6章 大数据分析工具:Pandas 148
6.1 Pandas系列 148
6.2 Pandas数据帧 151
6.3 Pandas面板 155
6.4 Pandas快速入门 158
6.5 本章小结 172
第7章 大数据分析工具:Statsmodels与Gensim 173
7.1 Statsmodels 173
7.1.1 Statsmodels统计数据库 173
7.1.2 Statsmodels典型的拟合模型概述 175
7.1.3 Statsmodels举例 176
7.2 Gensim 178
7.2.1 基本概念 178
7.2.2 训练语料的预处理 179
7.2.3 主题向量的变换 180
7.2.4 文档相似度的计算 181
7.3 本章小结 182
第8章 大数据分析算法与实例 183
8.1 描述统计 183
8.2 假设检验 188
8.3 信度分析 192
8.4 列联表分析 195
8.5 相关分析 196
8.6 方差分析 198
8.6.1 单因素方差分析 199
8.6.2 多因素方差分析 201
8.7 回归分析 203
8.8 聚类分析 207
8.9 判别分析 212
8.10 主成分分析 216
8.11 因子分析 218
8.12 时间序列分析 221
8.13 生存分析 224
8.14 典型相关分析 245
8.15 RoC分析 250
8.16 距离分析 255
8.17 对应分析 264
8.18 决策树分析 265
8.19 神经网络-深度学习 271
8.19.1 深度学习的基本模型 271
8.19.2 新闻分类实例 275
8.20 蒙特卡罗模拟 280
8.20.1 蒙特卡罗模拟基本模型 281
8.20.2 蒙特卡罗模拟计算看涨期权实例 281
8.21 关联规则 287
8.21.1 关联规则的概念 288
8.21.2 Apriori算法及实例 289
8.21.3 FP树频集算法 292
8.22 Uplift Modeling 301
8.23 集成方法 306
8.24 异常检测 311
8.25 文本挖掘 315
8.26 Boosting算法(提升法和Gradient Boosting) 322
8.27 本章小结 325
参考文献 326
內容試閱
前 言
大数据可以概括为5个V,数据量大(Volume)、速度快(Velocity)、类型多(Variety)、价值(Value)、真实性(Veracity)。随着大数据时代的来临,大数据分析也应运而生。大数据分析是指对规模巨大的数据进行分析。大数据分析在研究大量的数据的过程中寻找模式、相关性和其他有用的信息,可以帮助企业更好地适应经营环境的变化,并做出更明智的决策。
大数据分析6个基本流程:可视化分析、数据挖掘算法、预测判断、语义引擎、数据质量和数据管理、数据存储和数据仓库,本书从数据分析可视化入手实现数据展示。数据可视化借助于图形化的手段,清晰、快捷、有效地传达与沟通信息。从用户的角度,数据可视化可以让人快速抓住信息要点,使得关键的数据点从人类的眼睛快速通往大脑。数据可视化一般具备几个特点:准确性、创新性和简洁性。
本书的目的是展现基于Python 3大数据分析方法中的核心算法与实践,介绍的重点是数据特征算法分析及第三方开源库的场景应用,如NumPy、SciPy、Matplotlib、Pandas、StatsModels、Gensim等在大数据分析中的算法与实例应用。
本书可以作为计算机科学与工程、计算统计学和社会科学等专业的大学生或研究生的专业参考书,也可作为软件研究人员或从业人员的参考资料。由于大数据分析专业素材的多学科性,读者可以根据对应的知识背景参考对应的专业图书。
本书内容
本书分为8章,系统讲解了大数据的数据特征算法分析。第1、2章简要介绍了大数据分析的背景、应用及数据特征分析,第3~7章是典型开源工具介绍与场景应用,第8章是基于Python 3的典型大数据分析算法及应用实例。本书的例子都是在Python 3集成开发环境Anaconda 3中经过实际调试通过的典型案例,书中示例的大部分实验数据来源于GitHub,很多例子也给出了源代码的网址,读者可以参考实现。
代码下载
本书示例代码请扫描右边的二维码下载。
如果下载有问题,请联系booksaga@163.com,邮件主题为Python大数据分析算法与实例。
致谢
这里要感谢家人的支持与关爱。同时也要感谢我的同事,与他们的交流和探讨使得本书得以修正错误和完善知识结构。由于作者水平有限,书中有纰漏之处在所难免,恳请读者不吝赐教。

作者
2020年1月

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.