新書推薦:
《
海外中国研究·江南:中国文雅的源流
》
售價:NT$
347.0
《
迟缓的巨人:“大而不能倒”的反思与人性化转向
》
售價:NT$
352.0
《
我们去往何方:身体、身份和个人价值
》
售價:NT$
305.0
《
大学问·批判的武器:罗莎·卢森堡与同时代思想者的论争
》
售價:NT$
449.0
《
低薪困境:剖析日本经济低迷的根本原因
》
售價:NT$
301.0
《
穷人的银行家(诺贝尔和平奖获得者穆罕默德·尤努斯自传)
》
售價:NT$
347.0
《
绵延:文明分野与文化演进
》
售價:NT$
301.0
《
三神之战:罗马,波斯与阿拉伯帝国的崛起
》
售價:NT$
367.0
|
編輯推薦: |
不同类型文本数据的获取、清洗、组织和可视化 如何用NumPy和Pandas模块处理数值数据 探索用MySQL和MongoDB配置、填充、查询数据 网络创建、度量和分析 概率与统计以及机器学习的相关基本概念
|
內容簡介: |
《Python数据科学入门》以Python 语言讲解数据科学基础知识,涵盖了数据采集、清洗、存储、检索、转换、可视化、高级数据分析(网络分析)、统计和机器学习等内容。具体内容包括:数据科学的Python 核心特性,文本数据、数据库、表格形式的数值数据、series 和frame、网络数据的使用,数据的绘制,概率与统计,机器学习。 《Python数据科学入门》面向研究生和本科生、数据科学教员、刚入门的数据科学专业人员,以及那些想拥有一本参考手册来帮助记住所有Python 函数及参数的开发人员。
|
關於作者: |
Dmitry Zinoviev 计算机科学教授,自2001年起一直在萨福克大学任教。研究兴趣包括计算机模拟与建模、网络科学、社交网络分析以及数字人文。拥有莫斯科国立大学物理学硕士学位和纽约州立大学石溪分校计算机科学博士学位。
|
目錄:
|
第1 章 什么是数据科学1
第1 单元 数据分析步骤2
第2 单元 数据获取途径3
第3 单元 报告的结构4
轮到你了5
第2 章 数据科学的Python 核心6
第4 单元 理解基本的字符串函数6
第5 单元 选择合适的数据结构8
第6 单元 通过列表推导式理解列表9
第7 单元 使用计数器10
第8 单元 使用文件11
第9 单元 上网12
第10 单元 使用正则表达式实现模式匹配13
第11 单元 globbing 文件名与其他字符串17
第12 单元 Pickling 和Unpickling 数据18
轮到你了18
第3 章 使用文本数据20
第13 单元 处理HTML 文件20
第14 单元 处理CSV 文件24
第15 单元 读取JSON 文件25
第16 单元 处理自然语言中的文本27
轮到你了31
第4 章 使用数据库33
第17 单元 设置MySQL 数据库33
第18 单元 使用MySQL 数据库:命令行36
第19 单元 使用MySQL 数据库:pymysql39
第20 单元 改善文档存储:MongoDB41
轮到你了44
第5 章 使用表格形式的数值数据45
第21 单元 创建数组46
第22 单元 转置和重排48
第23 单元 索引和切片49
第24 单元 广播51
第25 单元 揭秘通用函数52
第26 单元 理解条件函数54
第27 单元 数组的聚合与排序54
第28 单元 将数组用作集合56
第29 单元 数组的保存和读取57
第30 单元 生成合成正弦波57
轮到你了59
第6 章 使用series 和frame61
第31 单元 pandas 数据结构62
第32 单元 数据重塑67
第33 单元 处理缺失数据72
第34 单元 组合数据75
第35 单元 数据的排序和描述78
第36 单元 数据转换82
第37 单元 掌握pandas 的文件读写功能87
轮到你了90
第7 章 使用网络数据91
第38 单元 概念剖析91
第39 单元 网络分析序列94
第40 单元 使用networkx95
轮到你了101
第8 章 绘图103
第41 单元 使用PyPlot 进行基本绘图104
第42 单元 了解其他绘图类型106
第43 单元 精通绘图装饰107
第44 单元 用pandas 绘图109
轮到你了111
第9 章 概率与统计113
第45 单元 回顾概率分布113
第46 单元 回顾统计度量115
第47 单元 以Python 的方式完成统计117
轮到你了120
第10 章 机器学习122
第48 单元 设计预测实验122
第49 单元 线性回归拟合124
第50 单元 用k 均值聚类实现数据分组129
第51 单元 在随机决策森林中生存131
轮到你了133
附录1 扩展阅读135
附录2 单星项目的解决方案137
参考文献 146
|
|