新書推薦:

《
正学堂稿(全二册)《儒藏》精华编选刊
》
售價:HK$
704

《
五个夸张的数学故事:支持儿童直接建立数学思维
》
售價:HK$
255

《
书写中国:从书迹流变溯源中华文明史 尔文智识生活系列 寻根汉字追踪文脉溯源中华理解中国
》
售價:HK$
806

《
餐桌边的哲学家:论饮食与人类
》
售價:HK$
245

《
经营:稻盛和夫谈原点
》
售價:HK$
403

《
魑魅魍魉:我们的心魔和怪物的意义
》
售價:HK$
454

《
湘江商潮起:东汉长沙郡商业研究
》
售價:HK$
347

《
舰船耐火材料
》
售價:HK$
1316
|
| 編輯推薦: |
真实案例驱动:以食品销售数据和无人售货机实战为主线,将ETL数据整合与处理全过程贯穿始终,强化理论与实践结合。 任务驱动学习:通过“获取、整合、统计、执行”完整流程,逐步培养数据处理思维与解决问题能力。 全面升级第二版:升级至Kettle 9.4.0,新增素养目标与实训环节,项目结构优化,案例更贴近实际业务。
|
| 內容簡介: |
本书以使用Kettle工具实现ETL流程为目标,将ETL知识点与项目任务相结合,配合真实案例,按照ETL的流程,循序渐进地介绍ETL数据整合与处理的相关内容。全书共6个项目,项目1介绍ETL概念和ETL工具等;项目2以获取食品销售源数据为例,介绍获取不同类型源数据的方法,并说明它们之间的差别;项目3以整合和处理某大型供应链集团的食品销售数据为例,介绍从获取多份源数据开始,使用排序、合并、剪切、拆分、删除、过滤、替换和输出等一系列与ETL流程相匹配的处理方法,整合和处理出一份符合项目阶段目标要求的数据的方法,帮助读者快速理解和掌握ETL;项目4以项目3的阶段目标数据作为源数据,介绍进行数据计算和统计的方法,以及将统计结果输出到不同类型的数据文件中的方式,帮助读者从业务上理解数据计算和统计的要求,以及输出结果的方法;项目5介绍Kettle的任务执行方式,构建任务流程,设定调度时间,自动执行项目3中整合和处理食品销售数据的任务;项目6介绍无人售货机项目,通过项目案例的形式,帮助读者将所学知识融会贯通。 本书可以作为高校大数据相关专业的教材,也可以作为ETL爱好者的自学用书。
|
| 關於作者: |
|
郑健,武昌职业学院,担任专职教师、如软件技术、信息安全技术应用专业教研室主任。获得软件著作权2项,专利2项;2023年“湖北工匠杯”职业技能大赛-计算机软件工程技术人员赛项一等奖,获得“湖北省技术能手”称号;2023年第五届全国高校计算机能力挑战赛评为“优秀指导教师”“优秀组织者”第二十二届武汉市职业技能大赛暨2021年武汉市职业院校技能大赛,指导学生获得一等奖,并获得“优秀指导教师”称号;2021、2022、2023、2024年连续4年获得新华三全国大学生数字技术大赛“优秀指导教师”。
|
| 目錄:
|
项目1 开启ETL之旅 1 任务1.1 认识ETL 1 1.1.1 了解ETL 2 1.1.2 选择ETL工具 4 任务1.2 配置Kettle运行环境 7 1.2.1 安装JDK 8 1.2.2 安装MySQL数据库 10 1.2.3 配置Kettle 11 任务1.3 熟悉Kettle的基本操作 12 1.3.1 认识Kettle界面 12 1.3.2 了解转换和任务 17 1.3.3 运行工程并查看执行结果 20 小结 22 实训 22 实训1 安装MySQL数据库 22 实训2 安装Kettle 23 课后习题 23 项目2 获取食品销售源数据 25 任务2.1 创建数据库连接 25 2.1.1 新建数据库连接 26 2.1.2 设置数据库连接参数 26 2.1.3 测试和浏览数据库连接 29 2.1.4 建立/停止共享数据库连接 30 任务2.2 获取数据库的食品销售数据 31 2.2.1 创建“表输入”组件 31 2.2.2 设置组件参数 32 2.2.3 预览获取的数据 34 任务2.3 获取CSV文件的食品销售数据 35 2.3.1 创建“CSV文件输入”组件 35 2.3.2 设置组件参数 35 2.3.3 预览获取的数据 38 任务2.4 获取Excel文件的食品销售数据 38 2.4.1 创建“Microsoft Excel input”组件 39 2.4.2 设置组件参数 39 2.4.3 预览获取的数据 47 小结 47 实训 48 实训1 获取数据库的日化销售数据 48 实训2 获取CSV文件的日化销售数据 48 实训3 获取Excel文件的日化销售数据 49 课后习题 49 项目3 整合和处理食品销售数据 51 任务3.1 处理多文件销售数据 52 3.1.1 排序文件数据 52 3.1.2 连接销售数据文件 56 3.1.3 字段选择 59 3.1.4 删除不规范的“销售时间”字段 64 3.1.5 替换“包装单位”字段的NULL值 67 任务3.2 合并销售数据 70 3.2.1 合并数据 70 3.2.2 合并所有的销售数据 74 任务3.3 剪切“平台”字段的字符串 76 3.3.1 创建“剪切字符串”组件 77 3.3.2 设置组件参数 77 3.3.3 预览结果数据 78 任务3.4 拆分“经营单位”字段 79 3.4.1 创建“拆分字段”组件 79 3.4.2 设置组件参数 79 3.4.3 预览结果数据 81 任务3.5 删除数据中的多余字段和重复记录 82 3.5.1 删除多余字段 82 3.5.2 删除重复记录 84 任务3.6 过滤并替换不规范的字段数据 87 3.6.1 设定条件过滤记录 87 3.6.2 规范字段数据 93 任务3.7 输出销售数据到数据库表 95 3.7.1 创建“表输出”组件 95 3.7.2 设置组件参数 96 3.7.3 预览结果数据 99 小结 99 实训 100 实训1 合并D平台的日化销售数据 100 实训2 处理B、C平台的日化销售数据 101 实训3 整合和处理A、B、C、D平台的日化销售数据 102 课后习题 102 项目4 统计食品销售数据 106 任务4.1 计算订单利润和利润率 106 4.1.1 创建计算订单利润和利润率的组件 107 4.1.2 设置组件参数 108 4.1.3 预览结果数据 109 任务4.2 计算单价 109 4.2.1 创建“计算器”组件 110 4.2.2 设置组件参数 110 4.2.3 预览结果数据 111 任务4.3 聚合统计销售额数据 112 4.3.1 聚合统计销售额 112 4.3.2 输出聚合统计结果 114 任务4.4 统计平台食品销售数据 119 4.4.1 分组统计 119 4.4.2 输出结果到数据库 123 任务4.5 统计分公司食品销售数据 125 4.5.1 评出“优秀经营单位” 125 4.5.2 插入结果到数据库 128 任务4.6 统计商品品牌食品销售数据 131 4.6.1 创建“SQL文件输出”组件 132 4.6.2 设置组件参数 133 4.6.3 预览结果数据 136 任务4.7 对销售额进行离散化统计 136 4.7.1 对销售额大小进行分段 137 4.7.2 分段统计并输出结果到Excel文件 139 小结 146 实训 146 实训1 计算日化销售数据中各个订单的利润、利润率 146 实训2 统计平台日化销售数据 147 实训3 统计分公司日化销售数据 147 实训4 统计各个商品品牌的日化销售数据 148 课后习题 148 项目5 执行整合与处理食品销售数据任务 151 任务5.1 开始任务 152 5.1.1 创建“Start”组件 152 5.1.2 设置组件参数 152 5.1.3 运行任务 153 任务5.2 检查输入源数据文件 155 5.2.1 检查源数据文件是否存在 155 5.2.2 等待文件上传 158 任务5.3 检查输出数据表 159 5.3.1 检查输出数据表是否存在 160 5.3.2 使用“SQL”组件生成输出数据表 161 任务5.4 执行数据整合与处理转换工程任务 164 5.4.1 创建“执行数据整合与处理工程”组件 164 5.4.2 设置组件参数 165 5.4.3 运行任务 169 任务5.5 添加日志文件 169 5.5.1 创建“添加文件到结果文件中”组件 169 5.5.2 设置组件参数 170 5.5.3 运行任务 171 任务5.6 发送日志邮件 172 5.6.1 创建“发送邮件”组件 172 5.6.2 设置组件参数 172 5.6.3 运行任务 176 任务5.7 结束任务 177 5.7.1 创建“成功”组件 177 5.7.2 设置组件参数 177 5.7.3 运行任务 178 小结 178 实训 178 实训1 执行日化销售数据整合与处理任务 178 实训2 执行统计日化销售数据任务 179 课后习题 180 项目6 无人售货机项目实战 183 任务6.1 了解无人售货机项目背景与目标 183 6.1.1 了解项目背景 184 6.1.2 熟悉项目目标 184 6.1.3 熟悉数据字段 184 任务6.2 统计客户订单数据 187 6.2.1 分析任务数据和数据处理需求 187 6.2.2 熟悉任务流程 188 6.2.3 实现客户订单数据的统计 189 任务6.3 统计商品销售数据 192 6.3.1 分析任务数据和数据处理需求 193 6.3.2 熟悉任务流程 193 6.3.3 实现商品销售数据的统计 194 任务6.4 统计无人售货机日销售数据 197 6.4.1 分析任务数据和数据处理需求 197 6.4.2 熟悉任务流程 198 6.4.3 实现无人售货机日销售数据的统计 199 任务6.5 统计无人售货机销售盈利数据 202 6.5.1 分析任务数据和数据处理需求 203 6.5.2 熟悉任务流程 204 6.5.3 实现无人售货机销售盈利数据的统计 205 小结 211 课后习题 212
|
|