新書推薦:

《
明清白话文献与吴语语法
》
售價:NT$
1010.0

《
祖宗之法:北宋前期政治述略(修订二版)
》
售價:NT$
500.0

《
德州扑克自学一本通
》
售價:NT$
255.0

《
数学分析(第一卷)(第7版)(精装典藏版)
》
售價:NT$
454.0

《
什么是思想史 历史学的实践丛书
》
售價:NT$
286.0

《
法律是什么:20世纪英美法理学批判阅读(全新增订版)
》
售價:NT$
296.0

《
从宁波到日本:生活世界的对话
》
售價:NT$
347.0

《
西夏史(历史通识书系)
》
售價:NT$
357.0
|
編輯推薦: |
1)采用“理实一体化”的教学方式。 2)丰富的教学案例,包含了书中的教学课件、习题答案等多种教学资源。 3)紧跟时代潮流,注重技术变化,书中包含了主流的大数据分析知识及一些开源库的使用。 4)编写本书的教师都具有多年的教学经验,重难点突出,能够激发学生的学习热情。 5)对本书中的重难点配有微课视频,方便学生课后学习。
|
內容簡介: |
本书主要介绍了大数据技术的基本概念与应用。全书共10章,包括大数据介绍、大数据架构、数据采集与清洗、大数据存储、大数据分析与挖掘、大数据可视化、数据治理、大数据安全、大数据的行业应用以及大数据综合实训。本书将理论与实践操作相结合,通过大量的案例帮助读者快速了解和应用大数据分析相关技术,并对书中重要的、核心的知识点加大练习的比例,以达到熟练应用的目的。 本书既可作为高等职业院校大数据技术专业、软件技术专业、计算机网络专业、工业互联网技术等计算机相关专业的教材,也可作为相关专业技术人员的参考用书。
|
關於作者: |
黄源,男,1980年生,重庆人,硕士研究生,教授,重庆航天职业技术学院教师,大数据技术与应用专业负责人,主要从事计算机网络技术、软件技术以及大数据技术与应用等领域的教学和研究工作。主持多项重庆市教改科研项目,主持多项重庆航天职业技术学院校级教改与科研项目。讲授课程包括Linux服务器配置与管理、HTML5前端开发、大数据导论、移动网站开发、大数据清洗、中小型网络规划设计与实施等,拥有较强的实践应用能力和创新能力。
|
目錄:
|
前言 第1章 大数据介绍 1.1 大数据概述 1.1.1 认识大数据 1.1.2 大数据的特征 1.1.3 大数据技术应用与基础 1.2 大数据的意义 1.2.1 大数据的国家战略意义 1.2.2 大数据的企业意义 1.2.3 我国大数据市场的预测 1.3 大数据的产业链分析 1.3.1 技术分析 1.3.2 运营分析 1.4 大数据与云计算 1.4.1 云计算概述 1.4.2 大数据与云计算的联系与区别 1.5 大数据与人工智能 1.5.1 人工智能概述 1.5.2 大数据与人工智能的联系与区别 1.6 实训1 用百度指数进行大数据分析 1.7 实训2 确定数据的不同类型 1.8 实训3 了解阿里云的使用 本章小结 习题1 第2章 大数据架构 2.1 大数据架构概述 2.1.1 大数据架构介绍 2.1.2 大数据架构分类 2.2 Hadoop架构 2.2.1 Hadoop介绍 2.2.2 Hadoop发展史 2.2.3 Hadoop核心组件 2.3 HDFS概述 2.3.1 HDFS的概念 2.3.2 HDFS的操作 2.4 MapReduce概述 2.4.1 MapReduce的概念 2.4.2 MapReduce设计方式 2.4.3 MapReduce架构 2.5 实训 Hadoop搭建(基于Windows7) 本章小结 习题2 第3章 数据采集与清洗 3.1 数据采集 3.1.1 数据采集介绍 3.1.2 数据采集平台 3.1.3 网络数据的采集 3.2 数据清洗 3.2.1 数据清洗概述 3.2.2 数据清洗的流程 3.2.3 数据清洗的常用方法 3.2.4 数据标准化概述 3.2.5 数据标准化的实例 3.3 数据仓库概述 3.3.1 数据仓库介绍 3.3.2 数据集成 3.3.3 数据变换 3.3.4 数据仓库的构建工具 3.4 Kettle工具概述 3.5 实训1 使用Python实现网络数据的采集 3.6 实训2 清洗Excel数据 3.7 实训3 清洗异常数据 3.8 实训4 使用Kettle进行数据 排序 本章小结 习题3 第4章 大
|
內容試閱:
|
大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。大数据已经成为推动经济转型发展的新动力,并促进生产组织方式的集约和创新。 当前,发展大数据已经成为国家战略,大数据在引领经济社会发展中的新引擎作用更加明显。2014年,“大数据”首次出现在《政府工作报告》中。报告中强调,要设立新兴产业创业创新平台,在大数据等方面赶超先进,引领未来产业发展。“大数据”从此逐渐在国内成为热议的词汇。2015年,国务院正式印发《促进大数据发展行动纲要》,《纲要》明确指出要不断地推动大数据发展和应用,在未来打造精准治理、多方协作的社会治理新模式,建立运行平稳、安全高效的经济运行新机制,构建以人为本、惠及全民的民生服务新体系,开启大众创业、万众创新的创新驱动新格局,培育高端智能、新兴繁荣的产业发展新生态。2020年12月28日,国家发展和改革委员会发布了《关于加快构建全国一体化大数据中心协同创新体系的指导意见》。《指导意见》的发布,意味着国家将在顶层设计上规范大数据产业发展,用“全国一盘棋”体系破除“数据孤岛”,从而促进大数据在行业、公司的应用场景落地和创新。2021年11月,工业和信息化部发布《“十四五”大数据产业发展规划》。《规划》提出了“十四五”时期我国大数据产业总体发展目标,即到2025年,我国大数据产业测算规模突破3万亿元,年均复合增长率保持在25%左右,创新力强、附加值高、自主可控的现代化大数据产业体系基本形成。 本书以“理论-实践操作”相结合的方式深入地讲解大数据技术的基本知识和实现,在内容设计上既有详细的理论与典型的案例;又有大量的实训环节,双管齐下,可极大地激发学生在课堂上的学习积极性与主动创造性,让学生在课堂上跟上老师的思维,从而学到更多有用的知识和技能。 本书共10章,包括大数据介绍、大数据架构、数据采集与清洗、大数据存储、大数据分析与挖掘、大数据可视化、数据治理、大数据安全、大数据的行业应用以及大数据综合实训。 本书特色如下。 1)采用“理实一体化”的教学方式。 2)丰富的教学案例,包含了书中的教学课件、习题答案等多种教学资源。 3)紧跟时代潮流,注重技术变化,书中包含了主流的大数据分析知识及一些开源库的使用。 4)编写本书的教师都具有多年的教学经验,重难点突
|
|