新書推薦:

《
通往权力之路:叶卡捷琳娜大帝
》
售價:NT$
658.0

《
西方毛发时尚演变
》
售價:NT$
500.0

《
法国革命史(史外一种:圣鞠斯特)
》
售價:NT$
500.0

《
情绪彩虹书:CBT与艺术的轻疗愈手册(珍藏版)
》
售價:NT$
1020.0

《
趣说中国女性
》
售價:NT$
347.0

《
被艺术疗愈的勇气:生活的答案之书
》
售價:NT$
408.0

《
故宫红书:故宫文化百科手册
》
售價:NT$
704.0

《
不被情绪内耗的10种能力
》
售價:NT$
357.0
|
編輯推薦: |
1.本书作者具有丰富的一线开发经验,深知读者需求和认知规律。
2.本书以丰富的实际案例驱动学习,每个章节围绕具体的大数据应用场景展开。
3.本书覆盖多个行业和应用场景的大数据案例,直击实际应用需求。
4.本书基本覆盖大数据的核心知识点,实战性极高,内容非常直观,可读性较强。
|
內容簡介: |
本书围绕大数据处理与分析,对其相关技术进行了详细的讲解。全书共9章,首先介绍了大数据分析的基本概念及可用的方法技术,然后介绍了如何使用Excel进行数据分析,包括数据探索与描述性分析、使用函数和工具、使用透视表与透视图等;介绍了如何使用Power BI进行数据分析,包括数据集成、数据清洗、数据规约、数据变换的基本操作,以及DAX函数的使用;介绍了如何使用Numpy进行数据计算以及如何使用Pandas进行数据分析。随后,介绍了一些数据可视化方法,分别介绍了Excel和Power BI中的数据可视化方法,还介绍了使用Matplotlib进行数据可视化的方法。最后,介绍了机器学习基础,并讲解了两个实践案例。本书从理论、实践两部分对大数据处理与分析进行了细致的讲解,旨在帮助读者更好地了解、使用大数据处理与分析的相关方法。
|
關於作者: |
安俊秀 主要研究方向为大数据分析与挖掘、人工智能等。现为成都信息工程大学并行计算与大数据研究所负责人,软件自动生成与智能服务四川省重点实验室学术带头人(领域知识本体和大数据方向)。在国内率先提出程序流模型,并将信息片段的消重和聚合处理过程并行化,实现数据的高效处理。
|
目錄:
|
第 1章 大数据分析基础 8
任务1.1 大数据分析的基本概念 8
1.1.1 大数据的定义与发展历程 8
1.1.2 大数据的特征 9
1.1.3 大数据分析的挑战 11
任务1.2 大数据分析方法与技术 14
1.2.1 统计分析与描述性分析 14
1.2.2 可视化分析 15
1.2.3 数据挖掘与机器学习 16
任务1.3 Python解释器与数据分析环境 17
1.3.1 安装Python解释器 17
1.3.2 安装IPython与Jupyter Notebook 24
习题 27
第 2章 Excel 数据分析技术 28
任务2.1 Excel数据分析概览 28
2.1.1 Excel基本介绍 28
2.1.2 Excel相关概念 29
2.1.3 获取外部数据 31
任务2.2 Excel数据探索与描述性分析 32
2.2.1 排序与筛选 32
2.2.2 数据分类汇总 41
2.2.3 条件格式 45
任务2.3 使用Excel函数和工具进行数据分析 47
2.3.1 统计函数 47
2.3.2 文本函数 53
2.3.3 日期和时间函数 55
2.3.4 数学函数 58
任务2.4 Excel数据透视表与透视图 61
2.4.1 数据透视的作用 61
2.4.2 数据透视表 61
2.4.3 数据透视图 65
习题 67
第3章 Power BI数据分析技术 68
任务3.1 Power BI数据分析概览 68
3.1.1 Power BI的安装 68
3.1.2 Power BI的界面与功能 73
3.1.3 Power BI Desktop与Power BI Service 80
3.1.4 数据加载与数据连接 82
任务3.2 Power BI基本操作 90
3.2.1 数据集成 90
3.2.2 数据清洗 91
3.2.3 数据归约 92
3.2.4 数据变换 93
任务3.3 数据建模分析 93
3.3.1 数据表关系 93
3.3.2 创建与管理数据模型 94
3.3.3 使用DAX进行数据计算 95
3.3.4 常用DAX函数介绍 99
习题 103
第4章 使用NumPy进行数据计算 106
任务4.1 NumPy数据计算概述 106
4.1.1 NumPy的安装 106
4.1.2 NumPy的优势与应用场景 106
任务4.2 NumPy的数组对象 107
4.2.1 创建数组对象 107
4.2.2 数组对象的常用属性 109
4.2.3 数组元素的访问与修改 110
4.2.4 数组对象的基础运算 112
4.2.5 数组对象的常用函数 114
任务4.3 NumPy的运算操作 118
4.3.1 位运算函数 118
4.3.2 数学函数 120
4.3.3 算术函数 121
4.3.4 统计函数 123
4.3.5 线性代数函数 125
习题 128
第5章 使用Pandas进行数据分析 130
任务5.1 Pandas数据分析概览 130
5.1.1 Pandas的安装 131
5.1.2 Pandas数据结构 131
任务5.2 Pandas的基本操作 134
5.2.1 导入与导出数据 134
5.2.2 数据的查看与描述 137
5.2.3 数据的选择与索引 140
5.2.4 数据的增删查改 142
任务5.3 Pandas分析方法 144
5.3.1 数据统计 144
5.3.2 算术运算与数据对齐 151
习题 153
第6章 Excel和Power BI数据可视化 155
任务6.1 使用Excel进行数据可视化展示 155
6.1.1 在Excel中插入图表 156
6.1.2 Excel图表相关要素 157
6.1.3 常用Excel图表类型 159
任务6.2 使用Power BI进行数据可视化分析 172
6.2.1 Power BI数据可视化方法 172
6.2.2 对比分析——条形图、柱形图、雷达图、漏斗图 174
6.2.3 结构分析——饼图、环形图、瀑布图、树状图 178
6.2.4 相关分析——散点图、折线图 181
6.2.5 描述性分析——表、箱线图 183
6.2.6 KPI分析——仪表、KPI Indicator、子弹图 184
习题 187
第7章 使用Matplotlib进行数据可视化 189
任务7.1 Matplotlib数据可视化概览 189
7.1.1 Matplotlib的安装 189
7.1.2 Matplotlib绘图步骤 190
任务7.2 Matplotlib基本图形元素 191
7.2.1 数据表达 192
7.2.2 图形标签和文本 193
7.2.3 图形格式和基本样式 197
任务7.3 典型图形绘制 199
7.3.1 折线图 199
7.3.2 散点图 200
7.3.3 柱状图 202
7.3.4 饼图 204
7.3.5 直方图 206
7.3.6 箱线图 208
习题 210
第8章 机器学习基础 214
任务8.1 机器学习介绍 214
8.1.1 机器学习是什么 214
8.1.2 机器学习的任务分类 215
8.1.3 机器学习流程 217
8.1.4 用Python实现机器学习算法 218
任务8.2 分类分析 249
8.2.1 分类分析是什么 249
8.2.2 分类评价指标 250
8.2.3 决策树与随机森林 251
8.2.4 朴素贝叶斯算法 253
任务8.3 聚类分析 254
8.3.1 聚类分析是什么 254
8.3.2 聚类评价指标 256
8.3.3 K均值聚类算法 257
任务8.4 关联规则分析 258
8.4.1 什么是关联规则 258
8.4.2 关联规则指标 260
8.4.3 Apriori算法 261
习题 262
第9章 实践案例 266
任务9.1 电商网站用户行为分类分析 267
9.1.1 特征工程 267
9.1.2 模型选择和训练 269
9.1.3 模型评估和优化 270
9.1.4 预测和应用 272
任务9.2 文本聚类分析 274
9.2.1 特征工程 274
9.2.2 聚类算法选择和实现 277
9.2.3 聚类结果分析和可视化 282
9.2.4 预测和应用 283
习题 286
|
|