新書推薦:

《
催化型领导力:破解新晋领导者的转型困境
》
售價:NT$
347.0

《
英国馆藏中国画
》
售價:NT$
500.0

《
又瘦,又美,又健康:女性减脂塑形避坑指南
》
售價:NT$
347.0

《
遥望与亲历:一个西方家庭眼中的中国(1887—1950)
》
售價:NT$
347.0

《
神的子民:古埃及人的风俗与日常. 第Ⅲ卷
》
售價:NT$
500.0

《
大学问·熙丰残照:北宋中期的改革
》
售價:NT$
500.0

《
万有引力书系 陪伴也是一种疗愈 从家庭到现实世界的幼儿观察
》
售價:NT$
454.0

《
如何操办我最好朋友的葬礼
》
售價:NT$
286.0
|
內容簡介: |
大数据导论课程旨在普及大数据知识,帮助学生理解大数据的概念及现实意义,掌握大数据的分析、处理和应用技术。本书围绕大数据的基本概念和大数据处理的主要环节展开,共8章。第1章主要介绍大数据的概念和特征、价值和作用、相关的政策法规等;第2章主要介绍大数据相关技术,包括云计算、人工智能和物联网;第3章主要介绍大数据采集与预处理的方法;第4章主要介绍大数据处理,包括3种主流的大数据处理框架(批处理框架Hadoop、流处理框架Storm 及混合处理框架Spark);第5章主要介绍大数据分析与挖掘的常用方法,包括数据的描述性分析方法、回归分析方法、数据挖掘的典型算法(关联分析算法、分类算法和聚类算法)及数据挖掘技术的典型应用等;第6章主要介绍大数据可视化的基础知识和案例,以及常用的大数据可视化工具和软件(FineBI、Matplotlib 和ECharts 等);第7章主要介绍大数据安全相关知识,包括大数据安全与隐私保护、大数据开放与共享,以及与大数据安全案例相关的政策法规;第8 章主要介绍大数据在互联网、金融、医疗、工业和智慧城市方面的应用。本书主要面向高等学校大数据相关专业的学生,同时也适合对大数据技术感兴趣的广大读者阅读。
|
關於作者: |
严宣辉,男,福建福州人,理学博士,福建师范大学计算机与网络空间安全学院教授。数字福建环境监测物联网实验室副主任、福建省人工智能学会理事。主要从事机器学习和数据挖掘、计算智能方面的研究,在国内外学术刊物上发表学术论文30余篇,主编与参编教材8部,主持完成省部级科研项目2项,参与国家和省部级科研项目14项、教改项目6项。先后担任过学院实验室主任和计算机科学系主任等工作。曾获得福建省教学成果一等奖1项、二等奖1项,校“福抗”教学奖和“集英奖教基金”教学奖。
|
目錄:
|
第1章 绪论1 1.1 数据1 1.1.1 数据的构成2 1.1.2 数据的存储容量单位4 1.2 大数据的相关概念4 1.2.1 大数据的概念4 1.2.2 大数据的基本特征5 1.3 大数据的意义、价值与作用6 1.3.1 大数据的意义7 1.3.2 大数据的价值8 1.3.3 大数据的作用9 1.4 大数据时代的新变革10 1.4.1 大数据带来的思维变革10 1.4.2 大数据带来的社会变革12 1.5 大数据处理的主要环节14 1.6 大数据的安全与共享16 1.6.1 大数据的开放与共享16 1.6.2 大数据安全与个人隐私保护17 1.6.3 我国大数据相关的安全政策法规18 1.7 大数据的发展现状与发展趋势20 1.7.1 大数据的发展现状20 1.7.2 大数据的发展趋势24 1.7.3 大数据时代面临的技术挑战26 1.8 本章小结27 1.9 习题27 第2章 大数据相关技术29 2.1 云计算与大数据29 2.1.1 云计算的基本概念29 2.1.2 云计算的基本要素与优势31 2.1.3 云计算的体系架构33 2.1.4 云计算的核心技术36 2.1.5 云计算的发展现状与主流平台38 2.1.6 云计算与大数据的关系44 2.2 人工智能与大数据44 2.2.1 人工智能的基本概念45 2.2.2 人工智能的研究领域47 2.2.3 人工智能的产业与应用52 2.2.4 人工智能与大数据的关系55 2.3 物联网与大数据56 2.3.1 物联网的基本概念57 2.3.2 物联网的核心技术59 2.3.3 物联网的产业与应用62 2.3.4 物联网、云计算、人工智能与大数据的关系65 2.4 本章小结66 2.5 习题66 第3章 大数据采集与预处理68 3.1 认识数据68 3.1.1 数据的属性和类型68 3.1.2 数据的量纲69 3.2 大数据的来源和采集途径70 3.2.1 大数据的来源70 3.2.2 大数据的采集途径70 3.3 常用的大数据采集工具72 3.3.1 爬山虎采集器72 3.3.2 八爪鱼采集器74 3.3.3 基于Python的网页抓取框架Scrapy75 3.3.4 日志采集工具Flume76 3.3.5 分布式消息服务工具Kafka78 3.4 数据预处理79 3.4.1 数据清洗79 3.4.2 数据集成83 3.4.3 数据变换84 3.4.4 数据归约88 3.5 使用OpenRefine对数据进行预处理88 3.6 本章小结93 3.7 习题93 第4章 大数据处理95 4.1 大数据处理框架95 4.1.1 主流大数据处理框架的简介95 4.1.2 批处理框架Hadoop简介98 4.1.3 流处理框架Storm简介101 4.1.4 混合处理框架Spark简介106 4.2 大数据存储与管理108 4.2.1 经典数据存储与管理技术108 4.2.2 分布式大数据存储与管理技术110 4.2.3 分布式文件系统HDFS112 4.2.4 分布式数据库系统HBase116 4.2.5 分布式数据仓库系统Hive118 4.3 大数据分布式计算121 4.3.1 分布式批处理框架Hadoop121 4.3.2 分布式流处理框架Storm125 4.3.3 分布式混合处理框架Spark127 4.4 本章小结131 4.5 习题131 第5章 大数据分析与挖掘133 5.1 引言133 5.2 描述性数据分析134 5.2.1 数据的集中趋势度量134 5.2.2 数据的离散趋势度量135 5.2.3 数据的偏态特性度量137 5.2.4 使用Excel对数据进行描述统计138 5.3 回归分析139 5.3.1 一元线性回归模型139 5.3.2 其他类型的回归模型142 5.4 关联分析的简介144 5.4.1 “啤酒与尿布”的故事144 5.4.2 常用的关联分析算法145 5.5 分类算法的简介148 5.5.1 近邻分类算法149 5.5.2 决策树算法150 5.6 聚类算法的简介151 5.6.1 主要的聚类算法类型152 5.6.2 k均值聚类算法153 5.6.3 层次聚类算法154 5.7 分布式数据挖掘算法156 5.8 数据挖掘技术的典型应用157 5.8.1 数据挖掘技术在生物信息学中的应用157 5.8.2 数据挖掘技术在市场营销领域中的应用158 5.8.3 数据挖掘技术在教育领域中的应用159 5.8.4 数据挖掘技术在金融领域中的应用159 5.9 本章小结160 5.10 习题160 第6章 大数据可视化162 6.1 引言162 6.1.1 什么是数据可视化162 6.1.2 数据可视化的若干案例163 6.1.3 数据可视化的作用165 6.2 数据可视化的案例165 6.2.1 数据集的简介166 6.2.2 发展趋势图166 6.2.3 人数分布图167 6.3 图形元素和视觉通道168 6.4 数据可视化的常用方法172 6.4.1 趋势型数据可视化方法172 6.4.2 对比型数据可视化方法174 6.4.3 比例型数据可视化方法176 6.4.4 分布型数据可视化方法178 6.4.5 文本数据可视化方法180 6.4.6 关系网络数据可视化方法181 6.4.7 时空数据可视化方法182 6.4.8 层次结构数据可视化方法183 6.4.9 高维数据可视化方法184 6.5 数据可视化的常用工具和软件的简介185 6.5.1 FineBI数据可视化工具的简介186 6.5.2 Tableau数据可视化工具的简介190 6.5.3 Python的Matplotlib的简介191 6.5.4 ECharts数据可视化编程库的简介193 6.6 本章小结194 6.7 习题195 第7章 大数据安全、开放与共享196 7.1 大数据安全与隐私保护196 7.1.1 大数据安全与隐私保护的概念196 7.1.2 大数据安全与隐私保护的挑战198 7.1.3 大数据安全与隐私保护的策略200 7.1.4 大数据信息安全技术的应用201 7.2 大数据生命周期中的安全与隐私204 7.2.1 大数据采集与传输中的安全与隐私204 7.2.2 大数据存储中的安全与隐私206 7.2.3 大数据分析与挖掘中的安全与隐私207 7.3 大数据开放与共享208 7.3.1 大数据开放与共享的概念208 7.3.2 大数据开放与共享的类别关系209 7.3.3 大数据开放与共享的挑战212 7.3.4 数据孤岛问题215 7.3.5 大数据开放与共享的措施220 7.4 大数据安全的典型案例222 7.4.1 大数据安全与隐私泄露的典型案例222 7.4.2 大数据开放与共享的典型案例224 7.4.3 大数据信息安全应用的典型案例225 7.5 本章小结227 7.6 习题227 第8章 大数据的行业应用229 8.1 互联网大数据的应用229 8.1.1 互联网大数据的简介229 8.1.2 零售业互联网大数据的应用232 8.1.3 房地产业互联网大数据的应用233 8.1.4 餐饮业互联网大数据的应用234 8.2 金融大数据的应用236 8.2.1 金融大数据的简介236 8.2.2 银行业金融大数据的应用239 8.2.3 证券业金融大数据的应用241 8.2.4 保险业金融大数据的应用242 8.3 医疗大数据的应用244 8.3.1 医疗大数据的简介244 8.3.2 临床大数据的应用247 8.3.3 健康管理大数据的应用249 8.3.4 基因检测大数据的应用251 8.4 工业大数据的应用252 8.4.1 工业大数据的简介252 8.4.2 设备故障诊断与健康管理255 8.4.3 生产质量分析258 8.4.4 生产效率优化259 8.5 智慧城市大数据的应用261 8.5.1 智慧城市大数据的简介261 8.5.2 智慧政务大数据264 8.5.3 智慧环境大数据265 8.5.4 智慧教育大数据268 8.6 本章小结268 8.7 习题269 参考文献271
|
|