新書推薦:
《
中国摄影 中式摄影的独特魅力
》
售價:NT$
4998.0
《
山西寺观艺术彩塑精编卷
》
售價:NT$
7650.0
《
积极心理学
》
售價:NT$
254.0
《
自由,不是放纵
》
售價:NT$
250.0
《
甲骨文丛书·消逝的光明:欧洲国际史,1919—1933年(套装全2册)
》
售價:NT$
1265.0
《
剑桥日本戏剧史(剑桥世界戏剧史译丛)
》
售價:NT$
918.0
《
中国高等艺术院校精品教材大系:材料的时尚表达??服装创意设计
》
售價:NT$
347.0
《
美丽与哀愁:第一次世界大战个人史
》
售價:NT$
653.0
|
編輯推薦: |
1.紧扣交通大数据分析全流程。本书的设计思路以数据分析的流程为导向,结合交通数据讲解流程中的每个环节,并通过课后习题巩固所学知识。2.注重项目实战应用。本书通过讲解实际交通行业的相关项目,让读者明确如何利用所学知识来解决生产、生活中的问题,真正理解并能够应用所学知识。3.注重启发式教学。全书大部分章节紧扣具体应用展开,不堆积知识点,着重于思路的启发与解决方案的实施。
|
內容簡介: |
本书以Python数据分析的常用技术与交通行业真实案例相结合的方式,深入浅出地介绍了Python数据分析与挖掘技术的重要内容。全书共10章,内容包括绪论、Python 数据分析简介、数据获取、数据探索、数据预处理、构建模型、运输车辆驾驶行为分析、公交车站点设置优化分析、铁路站点客流量预测,以及基于TipDM大数据挖掘建模平台实现运输车辆驾驶行为分析。本书大部分章节包含课后习题,通过练习和操作实践,读者可以巩固所学的内容。本书可作为高校数据分析相关专业的教材,也可作为交通行业相关的教学、培训教材,还可作为数据分析爱好者的自学用书。
|
關於作者: |
张良均,高级信息系统项目管理师,泰迪杯全国大学生数据挖掘竞(www.tipdm.org)的发起人。华南师范大学、广东工业大学兼职教授,广东省工业与应用数学学会理事。兼有大型高科技企业和高校的工作经历,主要从事大数据挖掘及其应用的策划、研发及咨询培训。全国计算机技术与软件专业技术资格(水平)考试继续教育和CDA数据分析师培训讲师。发表数据挖掘相关论文数二十余篇,已取得国家发明专利12项,主编图书《神经网络实用教程》、《数据挖掘:实用案例分析》、《MATLAB数据分析与挖掘实战》等9本热销图书,主持并完成科技项目9项。获得SAS、SPSS数据挖掘认证及Hadoop开发工程师证书,具有电力、电信、银行、制造企业、电子商务和电子政务的项目经验和行业背景。
|
目錄:
|
第 1章 绪论11.1 了解交通大数据 11.1.1 交通大数据的背景 11.1.2 交通大数据的应用 41.2 认识数据分析 51.2.1 掌握数据分析的基本任务 61.2.2 熟悉数据分析的基本流程 61.3 了解常用的数据分析工具 81.4 配置Python开发环境 91.4.1 安装Anaconda 91.4.2 掌握Jupyter Notebook的使用方法 12小结 14课后习题 14第 2章 Python数据分析简介 162.1 入门Python数据分析 162.1.1 了解基本命令 162.1.2 掌握数据结构 192.1.3 函数式编程 212.1.4 导入与添加库 232.2 了解Python数据分析常用扩展库 242.2.1 NumPy 252.2.2 SciPy 262.2.3 pandas 272.2.4 Matplotlib 282.2.5 scikit-learn 30小结 31课后习题 31第3章 数据获取 323.1 了解常见的数据来源 323.2 了解交通信息的采集 333.2.1 交通信息的分类与特点 333.2.2 常见的交通信息采集技术 343.3 了解常见的数据类型 353.4 掌握数据的读取方式 373.4.1 读取数据库数据 373.4.2 读取文件数据 38小结 40课后习题 40第4章 数据探索 414.1 分析数据质量 414.1.1 分析缺失值 414.1.2 分析异常值 424.2 分析数据特征 454.2.1 分析数据的统计量 454.2.2 分析数据的分布情况 484.2.3 对比分析数据 534.2.4 分析数据的周期性 564.2.5 分析数据的相关性 58小结 61课后习题 61第5章 数据预处理 635.1 数据清洗 635.1.1 处理缺失值 635.1.2 处理异常值 665.2 数据变换 665.2.1 函数变换 665.2.2 数据标准化 675.2.3 离散化连续型数据 695.3 属性构造 725.4 属性规约 735.5 数据合并 765.5.1 多表合并 775.5.2 分组聚合数据 84小结 92课后习题 92第6章 构建模型 946.1 构建分类与回归模型 946.1.1 常用的分类与回归算法 946.1.2 了解回归分析 956.1.3 了解朴素贝叶斯 996.1.4 了解决策树 1016.1.5 了解人工神经网络 1046.1.6 评价分类与回归模型 1096.2 构建聚类模型 1136.2.1 了解常用的聚类算法 1136.2.2 了解K-Means聚类 1146.2.3 了解密度聚类 1206.2.4 聚类模型评价 1246.3 构建时间序列模型 1266.3.1 了解常用的时间序列模型 1266.3.2 预处理时间序列 1276.3.3 分析平稳时间序列 1286.3.4 分析非平稳时间序列 131小结 140课后习题 140第7章 运输车辆驾驶行为分析 1427.1 分析背景与目标 1427.1.1 背景 1427.1.2 数据说明 1437.1.3 分析目标 1447.2 数据探索分析 1457.2.1 分布分析 1457.2.2 相关性分析 1467.2.3 异常值检测 1477.3 驾驶行为聚类分析 1497.3.1 K-Means聚类 1497.3.2 层次聚类 1527.3.3 高斯混合模型聚类 1537.3.4 谱聚类 1547.4 构建驾驶行为预测模型 1567.4.1 构建线性判别分析模型 1567.4.2 构建朴素贝叶斯模型 1577.4.3 构建神经网络模型 1597.5 驾驶行为分析总结与建议 160小结 160课后习题 160第8章 公交车站点设置优化分析 1628.1 分析背景与目标 1628.1.1 背景 1638.1.2 数据说明 1638.1.3 分析目标 1648.2 探索公交刷卡数据 1658.3 预处理公交车载GPS数据与刷卡数据 1668.3.1 属性规约 1668.3.2 缺失值处理 1668.3.3 数据去重 1678.4 构建DBSCAN模型 1688.5 公交车站点设置优化分析 1708.5.1 计算上车人数 1708.5.2 计算下车人数 1728.5.3 结果分析 176小结 177课后习题 177第9章 铁路站点客流量预测 1799.1 分析背景与目标 1799.1.1 背景 1799.1.2 数据说明 1809.1.3 分析目标 1809.2 预处理客流量数据 1819.3 探索客流量数据 1869.3.1 不同站点上下车客流量分布分析 1869.3.2 不同时段上下车客流量分布分析 1879.3.3 分析节假日客流量变化 1899.4 构建模型并预测客流量 1929.4.1 构建时间序列模型 1929.4.2 预测非节假日客流量 1959.4.3 预测节假日客流量 199小结 206课后习题 207第 10章 基于TipDM大数据挖掘建模平台实现运输车辆驾驶行为分析 20810.1 TipDM大数据挖掘建模平台简介 20810.1.1 模型库 21010.1.2 数据连接 21010.1.3 我的数据 21010.1.4 我的工程 21110.1.5 系统算法 21110.1.6 个人算法 21310.2 实现运输车辆驾驶行为分析 21410.2.1 数据源配置 21410.2.2 数据探索分析 21710.2.3 驾驶行为聚类分析 22210.2.4 构建驾驶行为预测模型 230小结 236第 1章 绪论 11.1 了解交通大数据 11.1.1 交通大数据的背景 11.1.2 交通大数据的应用 41.2 认识数据分析 51.2.1 掌握数据分析的基本任务 61.2.2 熟悉数据分析的基本流程 61.3 了解常用的数据分析工具 81.4 配置Python开发环境 91.4.1 安装Anaconda 91.4.2 掌握Jupyter Notebook的使用方法 12小结 14课后习题 14第 2章 Python数据分析简介 162.1 入门Python数据分析 162.1.1 了解基本命令 162.1.2 掌握数据结构 192.1.3 函数式编程 212.1.4 导入与添加库 232.2 了解Python数据分析常用扩展库 242.2.1 NumPy 252.2.2 SciPy 262.2.3 pandas 272.2.4 Matplotlib 282.2.5 scikit-learn 30小结 31课后习题 31第3章 数据获取 323.1 了解常见的数据来源 323.2 了解交通信息的采集 333.2.1 交通信息的分类与特点 333.2.2 常见的交通信息采集技术 343.3 了解常见的数据类型 353.4 掌握数据的读取方式 373.4.1 读取数据库数据 373.4.2 读取文件数据 38小结 40课后习题 40第4章 数据探索 414.1 分析数据质量 414.1.1 分析缺失值 414.1.2 分析异常值 424.2 分析数据特征 454.2.1 分析数据的统计量 454.2.2 分析数据的分布情况 484.2.3 对比分析数据 534.2.4 分析数据的周期性 564.2.5 分析数据的相关性 57小结 60课后习题 61第5章 数据预处理 635.1 数据清洗 635.1.1 处理缺失值 635.1.2 处理异常值 665.2 数据变换 665.2.1 函数变换 665.2.2 数据标准化 675.2.3 离散化连续型数据 695.3 属性构造 725.4 属性规约 735.5 数据合并 765.5.1 多表合并 775.5.2 分组聚合数据 84小结 92课后习题 92第6章 构建模型 946.1 构建分类与回归模型 946.1.1 常用的分类与回归算法 946.1.2 了解回归分析 956.1.3 了解朴素贝叶斯 996.1.4 了解决策树 1016.1.5 了解人工神经网络 1046.1.6 评价分类与回归模型 1096.2 构建聚类模型 1136.2.1 了解常用的聚类算法 1136.2.2 了解K-Means聚类 1146.2.3 了解密度聚类 1206.2.4 聚类模型评价 1246.3 构建时间序列模型 1266.3.1 了解常用的时间序列模型 1266.3.2 预处理时间序列 1276.3.3 分析平稳时间序列 1286.3.4 分析非平稳时间序列 131小结 140课后习题 140第7章 运输车辆驾驶行为分析 1427.1 分析背景与目标 1427.1.1 背景 1427.1.2 数据说明 1437.1.3 分析目标 1447.2 数据探索分析 1457.2.1 分布分析 1457.2.2 相关性分析 1467.2.3 异常值检测 1477.3 驾驶行为聚类分析 1497.3.1 K-Means聚类 1497.3.2 层次聚类 1527.3.3 高斯混合模型聚类 1537.3.4 谱聚类 1547.4 构建驾驶行为预测模型 1567.4.1 构建线性判别分析模型 1567.4.2 构建朴素贝叶斯模型 1577.4.3 构建神经网络模型 1597.5 驾驶行为分析总结与建议 160小结 160课后习题 160第8章 公交车站点设置优化分析 1628.1 分析背景与目标 1628.1.1 背景 1638.1.2 数据说明 1638.1.3 分析目标 1648.2 探索公交刷卡数据 1658.3 预处理公交车载GPS数据与刷卡数据 1668.3.1 属性规约 1668.3.2 缺失值处理 1668.3.3 数据去重 1678.4 构建DBSCAN模型 1688.5 公交车站点设置优化分析 1708.5.1 计算上车人数 1708.5.2 计算下车人数 1728.5.3 结果分析 176小结 177课后习题 177第9章 铁路站点客流量预测 1799.1 分析背景与目标 1799.1.1 背景 1799.1.2 数据说明 1809.1.3 分析目标 1809.2 预处理客流量数据 1819.3 探索客流量数据 1869.3.1 不同站点上下车客流量分布分析 1869.3.2 不同时段上下车客流量分布分析 1879.3.3 分析节假日客流量变化 1899.4 构建模型并预测客流量 1929.4.1 构建时间序列模型 1929.4.2 预测非节假日客流量 1959.4.3 预测节假日客流量 199小结 206课后习题 207第 10章 基于TipDM大数据挖掘建模平台实现运输车辆驾驶行为分析 20810.1 Tip DM大数据挖掘建模平台简介 20810.1.1 模型库 21010.1.2 数据连接 21010.1.3 我的数据 21010.1.4 我的工程 21110.1.5 系统算法 21110.1.6 个人算法 21310.2 实现运输车辆驾驶行为分析 21410.2.1 数据源配置 21410.2.2 数据探索分析 21710.2.3 驾驶行为聚类分析 22210.2.4 构建驾驶行为预测模型 230小结 236
|
|