| 
 新書推薦:
 
  《 
			财之道丛书·贪婪的游戏:金融投机100年
			》
 售價:HK$ 
			347
 
  《 
			算力崛起:重塑未来经济与社会
			》
 售價:HK$ 
			356
 
  《 
			敦煌壁画?纹样
			》
 售價:HK$ 
			704
 
  《 
			丑的美学 一部跨越两个世纪的美学沉思录
			》
 售價:HK$ 
			653
 
  《 
			智圆行方――燕京医学名家处方手迹藏臻
			》
 售價:HK$ 
			2030
 
  《 
			大设计师威廉·莫里斯
			》
 售價:HK$ 
			704
 
  《 
			新宏观经济学 来自后凯恩斯主义-老制度主义-马克思主义传统的第一本宏观经济学教科书
			》
 售價:HK$ 
			1316
 
  《 
			《山海经》的博物世界:植物(刷边特装版)博物岛系列 探寻上古草木之美纵览山川博物大观
			》
 售價:HK$ 
			1306
 
 
 | 
         
          | 編輯推薦: |   
          | 本书特色: (1)实战导向:突出“理论-工具-案例”三位一体的教学理念。
 (2)体系完整:覆盖数据分析、可视化到数据建模的全流程。
 (3)技术前沿:集成传统统计分析工具与Python机器学习库。
 (4)受众广泛:适合多层级、多领域读者自学或教学参考。
 为便于教学,本书提供丰富的配套资源,包括教学大纲、教学课件、教学进度表、在线作业、习题答案和1000分钟的微课视频。
 |  
         
          | 內容簡介: |   
          | ”本书从Python数据分析与挖掘的基础知识入手,结合大量案例,系统地阐述了数据分析与挖掘的相关概念、基本原理和典型算法,带领读者逐步掌握数据分析与挖掘的关键知识,提高解决实际问题的能力。本书主要内容包括绪论、Python编程基础、NumPy数值计算、Pandas数据分析、Python数据可视化、认识数据、数据预处理、回归分析、关联规则挖掘、分类、聚类、离群点检测以及文本和时序数据挖掘。   本书可作为高等院校数据科学与大数据技术、软件工程、计算机科学与技术、统计与应用等相关专业教材,也可作为Python数据分析与挖掘初学者和爱好者的参考书。 ” |  
         
          | 關於作者: |   
          | 魏伟一,西北师范大学教授,甘肃省省级一流课程”数据挖掘“课程负责人,主持国家自然科学基金项目1项、省级科研项目4项,主编出版教材《Python数据分析与可视化》的第1和第2版、《Python数据挖掘与机器学习》和《数据仓库与数据挖掘(Hadoop Hive Python)》4部,指导学生参加ICPC、蓝桥杯和天梯赛等学科竞赛获国家级奖项10余项,获得西北师范大学”优秀教师“和”优秀班主任“等称号,研究领域为计算机视觉、数据挖掘与机器学习等。 |  
         
          | 目錄: |   
          | 扫一扫 
 源码下载
 
 
 第1章绪论
 1.1数据分析与数据挖掘
 1.1.1数据分析
 1.1.2数据挖掘
 1.1.3数据分析与数据挖掘的联系
 1.2数据挖掘的主要任务
 1.2.1关联分析
 1.2.2数据的预测建模
 1.2.3聚类分析
 1.2.4离群点检测
 1.3数据挖掘的数据源
 1.3.1数据库数据
 1.3.2数据仓库
 1.3.3事务数据库
 1.3.4其他类型数据
 1.4数据挖掘使用的技术
 1.4.1统计学
 1.4.2机器学习
 1.4.3数据库系统与数据仓库
 1.5数据挖掘存在的主要问题
 1.6数据挖掘建模常用的工具
 1.6.1商用工具
 1.6.2开源工具
 1.7为何选用Python进行数据挖掘
 1.8Python数据挖掘常用的库
 1.9Jupyter Notebook的使用
 1.10小结
 习题1
 第2章Python编程基础
 2.1Python语言的基本语法
 2.1.1基础数据类型
 2.1.2变量和赋值
 2.1.3运算符和表达式
 2.1.4字符串
 2.1.5流程控制
 2.2内置数据类型
 2.2.1列表
 2.2.2元组
 2.2.3字典
 2.2.4集合
 2.3函数
 2.3.1函数的定义
 2.3.2lambda函数
 2.4文件操作
 2.4.1文件处理过程
 2.4.2数据的读取方法
 2.4.3读取CSV文件
 2.4.4文件的写入与关闭
 2.5小结
 习题2
 本章实训
 第3章NumPy数值计算
 3.1NumPy多维数组
 3.1.1创建数组对象
 3.1.2ndarray对象的属性和数据转换
 3.1.3生成随机数
 3.1.4数组变换
 3.2数组的索引和切片
 3.2.1一维数组的索引
 3.2.2多维数组的索引
 3.3数组的运算
 3.3.1数组和标量间的运算
 3.3.2ufunc函数
 3.3.3条件逻辑运算
 3.4数组的读/写
 3.4.1读/写二进制文件
 3.4.2读/写文本文件
 3.4.3读取CSV文件
 3.5NumPy中的数据统计与分析
 3.5.1排序
 3.5.2重复数据与去重
 3.5.3常用统计函数
 3.6小结
 习题3
 本章实训
 第4章Pandas数据分析
 4.1Pandas中的数据结构
 4.1.1Series
 4.1.2DataFrame
 4.1.3索引对象
 4.1.4查看DataFrame的常用属性
 4.2数据的载入
 4.2.1读/写文本文件
 4.2.2读/写Excel文件
 4.2.3读/写JSON数据
 4.2.4读取数据库文件
 4.3Pandas索引操作
 4.3.1重新索引
 4.3.2更换索引
 4.4DataFrame数据的查询与编辑
 4.4.1DataFrame数据的查询
 4.4.2DataFrame数据的编辑
 4.4.3DataFrame数据的变换
 4.5Pandas数据运算
 4.5.1算术运算
 4.5.2DataFrame数据的比较
 4.5.3函数应用和映射
 4.5.4排序
 4.5.5汇总与统计
 4.6数据分组与聚合
 4.6.1数据分组
 4.6.2数据聚合
 4.6.3分组运算
 4.7数据透视表
 4.7.1透视表
 4.7.2交叉表
 4.8Pandas可视化
 4.8.1线形图
 4.8.2柱状图
 4.8.3直方图
 4.8.4密度图
 4.8.5散点图
 4.9小结
 习题4
 本章实训
 第5章Python数据可视化
 5.1Matplotlib数据可视化
 5.1.1Matplotlib绘图基础
 5.1.2设置pyplot的rc参数
 5.1.3绘图的填充
 5.1.4文本注解
 5.1.5在绘图中显示公式
 5.1.6pyplot中的常用绘图
 5.1.7词云
 5.2Seaborn数据可视化
 5.2.1风格设置
 5.2.2Seaborn中的常用绘图
 5.3pyecharts数据可视化
 5.3.1pyecharts的使用方法
 5.3.2pyecharts中的常用绘图
 5.4小结
 习题5
 本章实训
 第6章认识数据
 6.1属性及其类型
 6.1.1属性
 6.1.2属性的类型
 6.2数据的基本统计描述
 6.2.1中心趋势度量
 6.2.2数据散布度量
 6.3数据可视化
 6.3.1基于像素的可视化技术
 6.3.2几何投影可视化技术
 6.3.3基于图符的可视化技术
 6.3.4层次可视化技术
 6.3.5可视化复杂对象和关系
 6.3.6高维数据可视化
 6.3.7Python可视化
 6.4数据对象的相似性度量
 6.4.1数据矩阵和相异性矩阵
 6.4.2标称属性的相似性度量
 6.4.3二元属性的相似性度量
 6.4.4数值属性的相似性度量
 6.4.5序数属性的相似性度量
 6.4.6混合类型属性的相似性
 6.4.7余弦相似性
 6.4.8距离度量的Python实现
 6.5小结
 习题6
 本章实训
 第7章数据预处理
 7.1数据预处理的必要性
 7.1.1原始数据中存在的问题
 7.1.2数据质量要求
 7.2数据清洗
 7.2.1数据清洗方法
 7.2.2使用Pandas进行数据清洗
 7.3数据集成
 7.3.1数据集成过程中的关键问题
 7.3.2使用Pandas合并数据
 7.4数据标准化
 7.4.1离差标准化数据
 7.4.2标准差标准化数据
 7.5数据归约
 7.5.1维归约
 7.5.2数量归约
 7.5.3数据压缩
 7.6数据变换与数据离散化
 7.6.1数据变换的策略
 7.6.2Python数据变换与离散化
 7.7使用scikitlearn进行数据预处理
 7.8小结
 习题7
 本章实训
 第8章回归分析
 8.1回归分析概述
 8.1.1回归分析的定义与分类
 8.1.2回归分析的过程
 8.1.3回归算法的评价
 8.2一元线性回归分析
 8.2.1一元线性回归方法
 8.2.2一元线性回归模型的参数估计
 8.2.3一元线性回归模型的误差项方差估计
 8.2.4一元线性回归模型的统计检验
 8.2.5一元线性回归的Python实现
 8.3多元线性回归
 8.3.1多元线性回归模型
 8.3.2多元线性回归模型的参数估计
 8.3.3多元线性回归的假设检验及评价
 8.3.4多元线性回归的Python实现
 8.4逻辑回归
 8.4.1逻辑回归模型
 8.4.2逻辑回归的Python实现
 8.5其他回归分析
 8.5.1多项式回归
 8.5.2岭回归
 8.5.3LASSO回归
 8.5.4弹性网络回归
 8.5.5逐步回归
 8.6小结
 习题8
 本章实训
 第9章关联规则挖掘
 9.1关联规则分析概述
 9.2频繁项集、闭项集和关联规则
 9.3频繁项集挖掘方法
 9.3.1Apriori算法
 9.3.2由频繁项集产生关联规则
 9.3.3提高Apriori算法的效率
 9.3.4频繁模式增长算法
 9.3.5使用垂直数据格式挖掘频繁项集
 9.4关联模式评估方法
 9.4.1强关联规则不一定是有趣的
 9.4.2从关联分析到相关分析
 9.5Apriori算法的应用
 9.6小结
 习题9
 本章实训
 
 第10章分类
 10.1分类概述
 10.2决策树归纳
 10.2.1决策树的原理
 10.2.2ID3算法
 10.2.3C4.5算法
 10.2.4CART算法
 10.2.5树的剪枝
 10.2.6决策树的应用
 10.3K近邻算法
 10.3.1算法的原理
 10.3.2Python算法的实现
 10.4支持向量机
 10.4.1算法的原理
 10.4.2Python算法的实现
 10.5贝叶斯分类
 10.5.1算法的原理
 10.5.2朴素贝叶斯分类
 10.5.3高斯朴素贝叶斯分类
 10.5.4多项式朴素贝叶斯分类
 10.5.5朴素贝叶斯分类的应用
 10.6神经网络
 10.6.1神经元模型
 10.6.2感知机与多层网络
 10.6.3BP神经网络
 10.6.4BP神经网络的应用
 10.7模型评估与选择
 10.7.1分类器性能的度量
 10.7.2模型选择
 10.8组合分类
 10.8.1组合分类方法简介
 10.8.2装袋
 10.8.3提升和AdaBoost
 10.8.4随机森林
 10.9小结
 习题10
 本章实训
 第11章聚类
 11.1聚类分析概述
 11.1.1聚类分析的概念
 11.1.2聚类算法的分类
 11.2KMeans聚类
 11.2.1算法的原理
 11.2.2算法的改进
 11.2.3KMeans算法的实现
 11.3层次聚类
 11.3.1算法的原理
 11.3.2簇间的距离度量
 11.3.3凝聚层次聚类
 11.3.4分裂层次聚类
 11.3.5层次聚类的应用
 11.4基于密度的聚类
 11.4.1算法的原理
 11.4.2算法的改进
 11.4.3DBSCAN算法的实现
 11.5其他聚类方法
 11.5.1STING聚类
 11.5.2概念聚类
 11.5.3模糊聚类
 11.5.4高斯混合模型聚类
 11.5.5近邻传播聚类
 11.6聚类评估
 11.6.1聚类趋势的估计
 11.6.2聚类簇数的确定
 11.6.3聚类质量的测定
 11.7小结
 习题11
 本章实训
 第12章离群点检测
 12.1离群点概述
 12.1.1离群点的概念
 12.1.2离群点的类型
 12.1.3离群点检测的挑战
 12.2离群点的检测
 12.2.1基于统计学的离群点检测
 12.2.2基于邻近性的离群点检测
 12.2.3基于聚类的离群点检测
 12.2.4基于分类的离群点检测
 12.3scikitlearn中的异常检测方法
 12.4小结
 习题12
 本章实训
 第13章文本和时序数据挖掘
 13.1文本数据挖掘
 13.1.1文本挖掘概述
 13.1.2文本挖掘的过程与任务
 13.1.3文本分析与挖掘的主要方法
 13.2时序数据挖掘
 13.2.1时间序列和时间序列数据分析
 13.2.2时间序列平稳性和随机性判定
 13.2.3自回归滑动平均(ARMA)模型
 13.2.4差分整合移动平均自回归(ARIMA)模型
 13.2.5季节性差分自回归移动平均(SARIMA)模型
 13.3小结
 习题13
 参考文献
 |  
         
          | 內容試閱: |   
          | 党的二十大报告指出: 教育、科技、人才是全面建设社会主义现代化国家的基础性、战略性支撑。必须坚持科技是第一生产力、人才是第一资源、创新是第一动力,深入实施科教兴国战略、人才强国战略、创新驱动发展战略,开辟发展新领域新赛道,不断塑造发展新动能新优势。高等教育与经济社会发展紧密相连,对促进就业创业、助力经济社会发展、增进人民福祉具有重要意义。 随着互联网和物联网等技术的飞速发展,海量的数据产生。对这些数据的存储、处理与分析带动了大数据技术的发展。其中,数据分析与挖掘结合了数据处理、统计分析和机器学习等领域的技术,可以帮助人们在庞大的数据中进行相关分析,找到有价值的信息和规律,使得人们对世界的认识更快、更便捷。在数据科学领域,Python语言由于其简单易用、第三方库强大的特点,深受数据分析与挖掘人员的青睐。
 本书从Python数据分析与挖掘的基础知识入手,结合大量的数据挖掘示例,系统介绍了数据分析与挖掘的原理、方法及应用,带领读者快速掌握Python数据分析与挖掘的相关知识,提高解决实际问题的能力。
 全书共13章,包括绪论、Python编程基础、NumPy数值计算、Pandas数据分析、Python数据可视化、认识数据、数据预处理、回归分析、关联规则挖掘、分类、聚类、离群点检测以及文本和时序数据挖掘等内容。书中各章内容相对独立,以利于读者选择性学习。每章内容力求原理叙述清晰简洁,突出理论联系实际,辅之以Python代码实践与指导,引领读者快速迈进数据分析与挖掘领域。同时,在每章后面设置了内容小结、习题以及实训练习,有利于读者对内容的理解和掌握。
 本书具有以下特色。
 (1) 实战导向: 突出“理论工具案例”三位一体的教学理念。
 (2) 体系完整: 覆盖数据分析、可视化到数据建模的全流程。
 (3) 技术前沿: 集成传统统计分析工具与Python机器学习库。
 (4) 受众广泛: 适合多层级、多领域读者自学或教学参考。
 为便于教学,本书提供丰富的配套资源,包括教学大纲、教学课件、电子教案、程序源码、教学进度表、在线作业、习题答案和1000分钟的微课视频。
 
 资源下载提示
 课件等资源: 扫描封底的“图书资源”二维码,在公众号“书圈”下载。
 素材(源码)等资源: 扫描目录上方的二维码下载。
 在线自测题: 扫描封底的作业系统二维码,再扫描自测题二维码,可以在线做题及查看答案。
 微课视频: 扫描封底的文泉云盘防盗码,再扫描书中相应章节的视频讲解二维码,可以在线学习。
 
 本书由西北师范大学魏伟一教授编写。由于编者水平有限,书中难免存在疏漏和不足之处,敬请读者批评指正。
 
 编者
 西北师范大学
 2025年1月
 |    |