《大数据、数据挖掘与智慧运营》 - 台灣·大書城 - 梁栋张兆静彭木根 - 清华大学出版社

	登入帳戶　 \|　訂單查詢　 \|　購物車/收銀台(0)　\|　在線留言板　 \|　付款方式　 \|　聯絡我們　 \|　運費計算　 \|　幫助中心　\|　加入書簽
		會員登入新用戶註冊

HOME

新書上架

暢銷書架

好書推介

2024年度TOP

香港／國際用戶

最新/最熱/最齊全的簡體書網

品種：超過100萬種書，正品正价，放心網購，悭钱省心

送貨：速遞 / 物流，時效：出貨後2-4日

『簡體書』大数据、数据挖掘与智慧运营

書城自編碼： 3093847
分類：簡體書→大陸圖書→計算機/網絡→數據庫
作者：梁栋张兆静彭木根
國際書號(ISBN)： 9787302483373
出版社：清华大学出版社
出版日期： 2017-11-01
版次： 1
頁數/字數： 403/494000
書度/開本： 16开釘裝：平装

售價：NT$ 713

我要買件

** 我創建的書架 **
未登入.

新書推薦：

《半小时漫画中国史（全5册）》
售價：NT$ 1273.0

《 7步吃透商业提案写作》
售價：NT$ 306.0

《大国谍影》
售價：NT$ 449.0

《制造消费者》
售價：NT$ 230.0

《精简写作：博报堂演讲撰稿人教你写出好文章（创意写作书系）》
售價：NT$ 301.0

《从荒诞到反抗：导读加缪《局外人》和《鼠疫》（谜文库）》
售價：NT$ 305.0

《给孩子的考古》
售價：NT$ 296.0

《文明的重建：战后德国五十年（译林思想史）从大屠杀刽子手到爱好和平的民主主义者，揭秘战后德国五十年奇迹般的复兴之路！》
售價：NT$ 505.0

建議一齊購買：

NT$ 324
《Python数据分析与应用》

NT$ 449
《洞见数据价值：大数据挖掘要案纪实》

NT$ 713
《Python数据分析与数据化运营》

NT$ 503
《首席增长官：如何用数据驱动增长》

NT$ 396
《数据化运营速成手册》

NT$ 518
《数据科学与大数据分析数据的发现分析可视化与表示》

編輯推薦：

随着移动互联网和物联网时代的来临，人和万事万物被广泛地联系在一起。人们在联系的过程产生了大量的数据，例如用户基础信息、网页浏览记录、历史消费记录、视频监控影像，等等。据此，以Google 为首的互联网公司提出了大数据（Big Data）的概念，并声称人类已经脱离了信息时代（Information Time，IT），进入了大数据时代（Data Time，DT）。显然，海量数据包含了非常丰富的浅层次信息和深层次知识。对于同一竞争领域的企业，谁能获取*量的数据，展开*精准的数据挖掘与建模分析，并加以精细化的落地实施，谁便能在行业竞争中取得优势。
对于运营商企业而言，其具备的一个显著优势便是手握海量数据资源。如果能运用先进的数据挖掘技术找出客户的行为规律，从传统的经验式、粗放式、一刀切式的运营决策向数据化、精细化、个性化的运营决策转型，运营商将迎来新的腾飞。上述运营模式转型的目标，便是所谓的智慧运营。

內容簡介：

本书系统地介绍了大数据挖掘的基本概念、经典挖掘算法、挖掘工具和企业智慧运营应用案例。
全书分为9章，内容包括：大数据挖掘与智慧运营的概念，数据预处理，数据挖掘中的四种主流算法：聚类分析、分类分析、回归分析、关联分析，增强型数据挖掘算法，数据挖掘在运营商智慧运营中的应用案例，未来大数据挖掘的发展趋势等。
全书以运用大数据挖掘方法提升企业运营业绩与效率为主线，从运营商实际工作中选取了大量运营和销售案例，详细讲述了数据采集、挖掘建模、模型落地与精准营销的全部过程。书中大部分案例的代码、软件操作流程和微课视频可以通过扫描本书封底的二维码下载。
本书主要面向运营商及其他高科技企业员工、高等院校相关专业本科生和研究生，以及其他对数据挖掘与精准营销感兴趣的读者。

關於作者：

梁栋，博士毕业于北京邮电大学信号与系统专业，现任教于北京邮电大学，硕士研究生导师，曾主持和参加多项国家自然科学基金项目、国家863课题项目、国家973科技项目和多项省部级科研项目，主要研究方向为大数据、数据挖掘与智慧运营，所带领的研究团队在包括IEEE Internet of things Journal、IEEE International Conference on Data Mining等著名学术期刊和会议上发表高水平学术论文20多篇，并且长期与中国移动等运营商企业进行科技产业化合作，在大数据、数据挖掘技术运用于企业智慧化运营方面有着丰富的落地经验。

第1章
大数据、数据挖掘与智慧运营综述 1

1.1 数据挖掘的发展史 2

1.1.1 数据挖掘的定义与起源 2

1.1.2 数据挖掘的早期发展 3

1.1.3 数据挖掘的算法前传 4

1.1.4 数据挖掘的第一个里程碑 8

1.1.5 最近十年的发展与应用 11

1.2 数据挖掘的主要流程与金字塔模型 13

1.2.1 数据挖掘的任务 14

1.2.2 数据挖掘的基本步骤 16

1.2.3 数据挖掘的架构云计算 17

1.2.4 金字塔模型 20

1.3 数据挖掘对智慧运营的意义 22

1.3.1 互联网时代的来临及其对运营商的冲击和挑战 22

1.3.2 大数据时代的来临及其对运营商的挑战和机遇
24

1.3.3 电信运营商运营发展面临的主要瓶颈 26

1.3.4 电信运营商发展的三条曲线 27

1.3.5 智慧运营与大数据变现 29

1.3.6 数据挖掘对于提升智慧运营效率的意义 30

1.4 大数据时代已经来临 31

1.4.1 大数据的定义 31

1.4.2 大数据的4V特征32

1.4.3 结构化数据与非结构化数据33

1.5 非结构化数据挖掘的研究进展 34

1.5.1 文本挖掘34

1.5.2 模式识别36

1.5.3 语音识别40

1.5.4 视频识别44

1.5.5 其他非结构化数据挖掘48

1.6 数据挖掘与机器学习、深度学习、人工智能及云计算 50

1.6.1 机器学习51

1.6.2 深度学习53

1.6.3 人工智能55

1.6.4 云计算56

1.7 现有数据挖掘的主要分析软件与系统 61

1.7.1 Hadoop61

1.7.2 Storm
63

1.7.3 Spark
65

1.7.4 SPASS（SPSS） 66

1.7.5 SAS
68
参考文献 70

第2章数据统计与数据预处理73

2.1 数据属性类型 74

2.1.1 数据属性定义74

2.1.2 离散属性74

2.1.3 连续属性75

2.2 数据的统计特性 77

2.2.1 中心趋势度量77

2.2.2 数据散布度量78

2.2.3 数据相关性82

2.3 数据预处理 87

2.3.1 数据预处理概述87

3.6 基于网格的聚类：CLIQUE 140

3.6.1 基于网格的聚类算法概述140

3.6.2 CLIQUE算法的基本原理141

3.6.3 CLIQUE算法的优势与劣势142
参考文献 143

第4章分类分析 145

4.1 分类分析概述 146

4.2 分类分析的评估 148

4.3 决策树分析 152

4.3.1 决策树算法的基本原理152

4.3.2 CHAID决策树160

4.3.3 ID3决策树 167

4.3.4 C4.5决策树171

4.3.5 CART 决策树175

4.3.6 决策树中的剪枝问题179

4.3.7 决策树在SPSS中的应用180

4.4 最近邻分析（KNN） 185

4.4.1 KNN算法的基本原理185

4.4.2 KNN算法流程186

4.4.3 KNN算法的若干问题187

4.4.4 KNN分类器的特征188

4.4.5 KNN算法在SPSS中的应用 188

4.5 贝叶斯分析 191

4.5.1 贝叶斯定理191

4.5.2 朴素贝叶斯分类192

4.5.3 贝叶斯网络195

4.6 神经网络 199

4.6.1 感知器200

4.6.2 多重人工神经网络201

4.6.3 人工神经网络的特点203

4.7 支持向量机 204

第6章关联分析 245

6.1 关联分析概述 246

6.2 关联分析的评估指标 247

6.2.1 支持度247

6.2.2 置信度248

6.2.3 算法复杂度248

6.3 Apriori 算法 249

6.3.1 频繁项集的定义与产生249

6.3.2 先验原理251

6.3.3 基于支持度的计数与剪枝252

6.3.4 候选项集生成253

6.3.5 基于置信度的剪枝259

6.3.6 Apriori算法规则生成 259

6.4 FP-tree 算法 261

6.4.1 频繁模式树261

6.4.2 FP-tree算法频繁项集的产生263

6.4.3 FP-tree算法规则生成263

6.4.4 算法性能对比与评估264

6.5 SPSS Modeler 关联分析实例 265
参考文献 269

第7章增强型数据挖掘算法 271

7.1 增强型数据挖掘算法概述 272

7.1.1 组合方法的优势272

7.1.2 构建组合分类器的方法272

7.2 随机森林 273

7.2.1 随机森林的原理273

7.2.2 随机森林的优缺点276

7.2.3 随机森林的泛化误差276

7.2.4 输入特征的选择方法277

7.3 Bagging 算法 277

8.4.4 多元线性回归建模350

8.4.5 制定层次化、个性化精准营销方案351

8.4.6 落地效果评估与模型调优352

8.5 客户保有 353

8.5.1 总结客户流失的历史规律354

8.5.2 细分潜在流失客户群体357

8.5.3 客户保有效益建模与最优决策359

8.5.4 落地效果评估361

8.6 投诉预警 363

8.6.1 客户投诉现象分析363

8.6.2 挖掘潜在客户群体366

8.6.3 制定个性化关怀方案368

8.7 网络质量栅格化呈现 368

8.7.1 栅格化呈现的基本原理369

8.7.2 覆盖栅格化370

8.7.3 基于流量聚簇的网络优化策略372

8.8 无线室内定位 376

8.8.1 传统室内定位方法376

8.8.2 基于Wi-Fi 信号的指纹定位算法 378

8.8.3 基于数据挖掘算法的改进定位方法379
参考文献 383

第9章面向未来大数据的数据挖掘与机器学习发展趋势 385

9.1 大数据时代数据挖掘与机器学习面临的新挑战 386

9.2 IEEE ICDM 会议数据挖掘与机器学习的最新研究进展 395

9.3 计算机奥运会Sort
Benchmark 400
参考文献 402

內容試閱：

数据挖掘（Data Mining），是指从数据中发现知识的过程（Knowledge Discovery
in Databases，KDD。狭义的数据挖掘一般指从大量的、不完全的、有噪声的、模糊
的、随机的实际应用数据中，提取隐含其中的、人们事先不知道的、但又是潜在有用
知识的过程。自从计算机发明之后，科学家们先后提出了许多优秀的数据挖掘算法。
2006年12月，在数据挖掘领域的权威学术会议the IEEE International Conference on
Data Mining（ICDM）上，科学家们评选出了该领域的十大经典算法：C4.5、K-Means、
SVM、Apriori、EM、PageRank、 AdaBoost、kNN、Naive Bayes和CART。这是数据
挖掘学科的一个重要里程碑，从此数据挖掘在理论研究和实际应用两方面均进入飞速
发展时期，并得到广泛关注。

在实际生产活动中，许多问题都可以用数据挖掘方法来建模，从而提升运营效率。
例如，某企业在其移动终端应用（App）上售卖各种商品，它希望向不同的客户群体
精准推送差异化的产品和服务，从而提升销售业绩。在这个案例中，如何将千万量级
的客户划分为不同的客户群体，可以由数据挖掘中的聚类分析算法来完成；针对某个
客户群体，如何判断某个产品是否是他们感兴趣的，可以由数据挖掘中的分类分析算
法来完成；如何发现某个客户群体感兴趣的各种产品之间的关联性，应该把哪些产品
打包为套餐，可以由数据挖掘中的关联分析算法来完成；如何发现某个客户群体的兴
趣爱好的长期趋势，可以由数据挖掘中的回归算法来完成；如何综合考虑公司的KPI
指标、营销政策和App页面限制等条件，制订最终的落地营销方案，可以基于数据
挖掘中的ROC曲线建立数学模型求得最优解来解决。

当前，许多企业正面临前所未有的竞争压力。以运营商企业为例，从政策层面看，
国家提出了提速降费的战略指示：一方面要提高网络连接速度、提供更好的服务，
这意味着公司成本的提高；另一方面要降低资费标准，这意味着单个产品收入的下降，
运营商该如何化解这对矛盾？从运营商内部数据统计看，传统的语音和短信、彩信业务收入占比正不断下降，传统的利润点已经风光不再；流量收入目前已占据主要位置
并保持上涨趋势，但单纯的流量经营又将面临管道化压力；未来的利润增长点要
让位于被称为第三条曲线的数字化服务。运营商该如何经营这一新鲜事物？从外
部环境看，互联网和电子商务企业借助其在各方面的优势，已经对运营商形成了巨大
的压力，特别是在数字化服务营销领域，传统运营商企业已经不再具备优势，又该如
何应对互联网企业的全面竞争？

随着移动互联网和物联网时代的来临，人和万事万物被广泛地联系在一起。人
们在联系的过程产生了大量的数据，例如用户基础信息、网页浏览记录、历史消费记
录、视频监控影像，等等。据此，以Google 为首的互联网公司提出了大数据（Big
Data）的概念，并声称人类已经脱离了信息时代（Information
Time，IT），进入了大
数据时代（Data Time，DT）。显然，海量数据包含了非常丰富的浅层次信息和深层
次知识。对于同一竞争领域的企业，谁能获取最大量的数据，展开最精准的数据挖掘
与建模分析，并加以精细化的落地实施，谁便能在行业竞争中取得优势。对于运营商
企业而言，其具备的一个显著优势便是手握海量数据资源。如果能运用先进的数据挖
掘技术找出客户的行为规律，从传统的经验式、粗放式、一刀切式的运营决策向
数据化、精细化、个性化的运营决策转型，运营商将迎来新的腾飞。上述运营模式转
型的目标，便是所谓的智慧运营。

目前，人类对大数据尚没有统一的、公认的定义，但几乎所有学者和企业都认同
大数据具备四大特征（四大挑战）：体量巨大（Volume ）、类型繁多（Variety ）、价
值密度低（Value ）、需要实时处理（Velocity ）。这其中最重要的一点是类型繁多，
即过去人类的数据储备以结构化数据为主，而未来将以非结构化数据为主。回到之前
提到的App 营销案例，企业基于用户的基础信息、历史消费信息、简单的网络行为
信息等结构化数据展开挖掘建模，被认为是传统的基于数据挖掘的智慧运营。随
着时代的发展，企业还掌握了用户观看在线视频的内容数据、在营业网点接受营业员
推荐的表情信息和语言交流数据、用户在客服热线中的语音咨询数据等。这些数据被
统称为非结构化数据，随着语音识别、人脸识别、语义识别等新技术的发展成熟，对
非结构化数据的分析挖掘已成为可能，并将获得广阔的商业应用空间。基于非结构化
数据的挖掘建模又被称为基于人工智能的智慧运营。考虑当前大部分企业的实际
运营现状，本书将主要围绕基于数据挖掘的智慧运营展开讨论，基于人工智能
的智慧运营将在后续书籍中展开讨论。

本书共分为九章：第1 章大数据、数据挖掘与智慧运营综述，讲述数据挖掘的基
本概念和发展史、大数据的时代特征、当前结构化数据挖掘进展、非结构化数据挖掘

書城介紹　 \|　合作申請　\|　索要書目　 \|　新手入門　\|　聯絡方式　 \|　幫助中心　\|　找書說明　 \|　送貨方式　\|　付款方式	台灣用户　\|　香港/海外用户

megBook.com.tw
Copyright (C) 2013 - 2025 （香港）大書城有限公司　All Rights Reserved.