登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入   新用戶註冊
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2024年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / 物流,時效:出貨後2-4日

2025年10月出版新書

2025年09月出版新書

2025年08月出版新書

2025年07月出版新書

2025年06月出版新書

2025年05月出版新書

2025年04月出版新書

2025年03月出版新書

2025年02月出版新書

2025年01月出版新書

2024年12月出版新書

2024年11月出版新書

2024年10月出版新書

2024年09月出版新書

2024年08月出版新書

『簡體書』ETL数据整合与处理(Kettle)(第2版)(微课版)

書城自編碼: 4164237
分類: 簡體書→大陸圖書→教材研究生/本科/专科教材
作者: 郑健,张良均
國際書號(ISBN): 9787115665478
出版社: 人民邮电出版社
出版日期: 2025-10-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 305

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
正学堂稿(全二册)《儒藏》精华编选刊
《 正学堂稿(全二册)《儒藏》精华编选刊 》

售價:HK$ 704
五个夸张的数学故事:支持儿童直接建立数学思维
《 五个夸张的数学故事:支持儿童直接建立数学思维 》

售價:HK$ 255
书写中国:从书迹流变溯源中华文明史 尔文智识生活系列 寻根汉字追踪文脉溯源中华理解中国
《 书写中国:从书迹流变溯源中华文明史 尔文智识生活系列 寻根汉字追踪文脉溯源中华理解中国 》

售價:HK$ 806
餐桌边的哲学家:论饮食与人类
《 餐桌边的哲学家:论饮食与人类 》

售價:HK$ 245
经营:稻盛和夫谈原点
《 经营:稻盛和夫谈原点 》

售價:HK$ 403
魑魅魍魉:我们的心魔和怪物的意义
《 魑魅魍魉:我们的心魔和怪物的意义 》

售價:HK$ 454
湘江商潮起:东汉长沙郡商业研究
《 湘江商潮起:东汉长沙郡商业研究 》

售價:HK$ 347
舰船耐火材料
《 舰船耐火材料 》

售價:HK$ 1316

編輯推薦:
真实案例驱动:以食品销售数据和无人售货机实战为主线,将ETL数据整合与处理全过程贯穿始终,强化理论与实践结合。
任务驱动学习:通过“获取、整合、统计、执行”完整流程,逐步培养数据处理思维与解决问题能力。
全面升级第二版:升级至Kettle 9.4.0,新增素养目标与实训环节,项目结构优化,案例更贴近实际业务。
內容簡介:
本书以使用Kettle工具实现ETL流程为目标,将ETL知识点与项目任务相结合,配合真实案例,按照ETL的流程,循序渐进地介绍ETL数据整合与处理的相关内容。全书共6个项目,项目1介绍ETL概念和ETL工具等;项目2以获取食品销售源数据为例,介绍获取不同类型源数据的方法,并说明它们之间的差别;项目3以整合和处理某大型供应链集团的食品销售数据为例,介绍从获取多份源数据开始,使用排序、合并、剪切、拆分、删除、过滤、替换和输出等一系列与ETL流程相匹配的处理方法,整合和处理出一份符合项目阶段目标要求的数据的方法,帮助读者快速理解和掌握ETL;项目4以项目3的阶段目标数据作为源数据,介绍进行数据计算和统计的方法,以及将统计结果输出到不同类型的数据文件中的方式,帮助读者从业务上理解数据计算和统计的要求,以及输出结果的方法;项目5介绍Kettle的任务执行方式,构建任务流程,设定调度时间,自动执行项目3中整合和处理食品销售数据的任务;项目6介绍无人售货机项目,通过项目案例的形式,帮助读者将所学知识融会贯通。
本书可以作为高校大数据相关专业的教材,也可以作为ETL爱好者的自学用书。
關於作者:
郑健,武昌职业学院,担任专职教师、如软件技术、信息安全技术应用专业教研室主任。获得软件著作权2项,专利2项;2023年“湖北工匠杯”职业技能大赛-计算机软件工程技术人员赛项一等奖,获得“湖北省技术能手”称号;2023年第五届全国高校计算机能力挑战赛评为“优秀指导教师”“优秀组织者”第二十二届武汉市职业技能大赛暨2021年武汉市职业院校技能大赛,指导学生获得一等奖,并获得“优秀指导教师”称号;2021、2022、2023、2024年连续4年获得新华三全国大学生数字技术大赛“优秀指导教师”。
目錄
项目1 开启ETL之旅 1
任务1.1 认识ETL 1
1.1.1 了解ETL 2
1.1.2 选择ETL工具 4
任务1.2 配置Kettle运行环境 7
1.2.1 安装JDK 8
1.2.2 安装MySQL数据库 10
1.2.3 配置Kettle 11
任务1.3 熟悉Kettle的基本操作 12
1.3.1 认识Kettle界面 12
1.3.2 了解转换和任务 17
1.3.3 运行工程并查看执行结果 20
小结 22
实训 22
实训1 安装MySQL数据库 22
实训2 安装Kettle 23
课后习题 23
项目2 获取食品销售源数据 25
任务2.1 创建数据库连接 25
2.1.1 新建数据库连接 26
2.1.2 设置数据库连接参数 26
2.1.3 测试和浏览数据库连接 29
2.1.4 建立/停止共享数据库连接 30
任务2.2 获取数据库的食品销售数据 31
2.2.1 创建“表输入”组件 31
2.2.2 设置组件参数 32
2.2.3 预览获取的数据 34
任务2.3 获取CSV文件的食品销售数据 35
2.3.1 创建“CSV文件输入”组件 35
2.3.2 设置组件参数 35
2.3.3 预览获取的数据 38
任务2.4 获取Excel文件的食品销售数据 38
2.4.1 创建“Microsoft Excel input”组件 39
2.4.2 设置组件参数 39
2.4.3 预览获取的数据 47
小结 47
实训 48
实训1 获取数据库的日化销售数据 48
实训2 获取CSV文件的日化销售数据 48
实训3 获取Excel文件的日化销售数据 49
课后习题 49
项目3 整合和处理食品销售数据 51
任务3.1 处理多文件销售数据 52
3.1.1 排序文件数据 52
3.1.2 连接销售数据文件 56
3.1.3 字段选择 59
3.1.4 删除不规范的“销售时间”字段 64
3.1.5 替换“包装单位”字段的NULL值 67
任务3.2 合并销售数据 70
3.2.1 合并数据 70
3.2.2 合并所有的销售数据 74
任务3.3 剪切“平台”字段的字符串 76
3.3.1 创建“剪切字符串”组件 77
3.3.2 设置组件参数 77
3.3.3 预览结果数据 78
任务3.4 拆分“经营单位”字段 79
3.4.1 创建“拆分字段”组件 79
3.4.2 设置组件参数 79
3.4.3 预览结果数据 81
任务3.5 删除数据中的多余字段和重复记录 82
3.5.1 删除多余字段 82
3.5.2 删除重复记录 84
任务3.6 过滤并替换不规范的字段数据 87
3.6.1 设定条件过滤记录 87
3.6.2 规范字段数据 93
任务3.7 输出销售数据到数据库表 95
3.7.1 创建“表输出”组件 95
3.7.2 设置组件参数 96
3.7.3 预览结果数据 99
小结 99
实训 100
实训1 合并D平台的日化销售数据 100
实训2 处理B、C平台的日化销售数据 101
实训3 整合和处理A、B、C、D平台的日化销售数据 102
课后习题 102
项目4 统计食品销售数据 106
任务4.1 计算订单利润和利润率 106
4.1.1 创建计算订单利润和利润率的组件 107
4.1.2 设置组件参数 108
4.1.3 预览结果数据 109
任务4.2 计算单价 109
4.2.1 创建“计算器”组件 110
4.2.2 设置组件参数 110
4.2.3 预览结果数据 111
任务4.3 聚合统计销售额数据 112
4.3.1 聚合统计销售额 112
4.3.2 输出聚合统计结果 114
任务4.4 统计平台食品销售数据 119
4.4.1 分组统计 119
4.4.2 输出结果到数据库 123
任务4.5 统计分公司食品销售数据 125
4.5.1 评出“优秀经营单位” 125
4.5.2 插入结果到数据库 128
任务4.6 统计商品品牌食品销售数据 131
4.6.1 创建“SQL文件输出”组件 132
4.6.2 设置组件参数 133
4.6.3 预览结果数据 136
任务4.7 对销售额进行离散化统计 136
4.7.1 对销售额大小进行分段 137
4.7.2 分段统计并输出结果到Excel文件 139
小结 146
实训 146
实训1 计算日化销售数据中各个订单的利润、利润率 146
实训2 统计平台日化销售数据 147
实训3 统计分公司日化销售数据 147
实训4 统计各个商品品牌的日化销售数据 148
课后习题 148
项目5 执行整合与处理食品销售数据任务 151
任务5.1 开始任务 152
5.1.1 创建“Start”组件 152
5.1.2 设置组件参数 152
5.1.3 运行任务 153
任务5.2 检查输入源数据文件 155
5.2.1 检查源数据文件是否存在 155
5.2.2 等待文件上传 158
任务5.3 检查输出数据表 159
5.3.1 检查输出数据表是否存在 160
5.3.2 使用“SQL”组件生成输出数据表 161
任务5.4 执行数据整合与处理转换工程任务 164
5.4.1 创建“执行数据整合与处理工程”组件 164
5.4.2 设置组件参数 165
5.4.3 运行任务 169
任务5.5 添加日志文件 169
5.5.1 创建“添加文件到结果文件中”组件 169
5.5.2 设置组件参数 170
5.5.3 运行任务 171
任务5.6 发送日志邮件 172
5.6.1 创建“发送邮件”组件 172
5.6.2 设置组件参数 172
5.6.3 运行任务 176
任务5.7 结束任务 177
5.7.1 创建“成功”组件 177
5.7.2 设置组件参数 177
5.7.3 运行任务 178
小结 178
实训 178
实训1 执行日化销售数据整合与处理任务 178
实训2 执行统计日化销售数据任务 179
课后习题 180
项目6 无人售货机项目实战 183
任务6.1 了解无人售货机项目背景与目标 183
6.1.1 了解项目背景 184
6.1.2 熟悉项目目标 184
6.1.3 熟悉数据字段 184
任务6.2 统计客户订单数据 187
6.2.1 分析任务数据和数据处理需求 187
6.2.2 熟悉任务流程 188
6.2.3 实现客户订单数据的统计 189
任务6.3 统计商品销售数据 192
6.3.1 分析任务数据和数据处理需求 193
6.3.2 熟悉任务流程 193
6.3.3 实现商品销售数据的统计 194
任务6.4 统计无人售货机日销售数据 197
6.4.1 分析任务数据和数据处理需求 197
6.4.2 熟悉任务流程 198
6.4.3 实现无人售货机日销售数据的统计 199
任务6.5 统计无人售货机销售盈利数据 202
6.5.1 分析任务数据和数据处理需求 203
6.5.2 熟悉任务流程 204
6.5.3 实现无人售货机销售盈利数据的统计 205
小结 211
课后习题 212

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 台灣用户 | 香港/海外用户
megBook.com.tw
Copyright (C) 2013 - 2025 (香港)大書城有限公司 All Rights Reserved.