| 
 新書推薦:
 
  《 
			美学四讲
			》
 售價:HK$ 
			332
 
  《 
			不可辨识的生命—影像 融合文化研究、后现代视角与图像学,评析戏剧影视艺术,洞察社会思潮,思想美学并重
			》
 售價:HK$ 
			398
 
  《 
			大国重器—中国盾构机创新发展之路
			》
 售價:HK$ 
			551
 
  《 
			长路行(带你看民国顶级书香世家的真实生活日常)
			》
 售價:HK$ 
			347
 
  《 
			人体脂肪的秘密
			》
 售價:HK$ 
			352
 
  《 
			社会史:理论与实践(增订版)(德国著名社会史学家于尔根·科卡重要文集。全面展现德国社会史学派的兴起与
			》
 售價:HK$ 
			500
 
  《 
			津巴多时间心理学 首次系统论述时间观疗法 菲利普·津巴多 著 自我觉察 活在当下 津巴多 心理学 当
			》
 售價:HK$ 
			352
 
  《 
			亲爱的族人:菲利普王之战的新叙事(横扫北美史学界各项大奖 以印第安女王视角重写北美大陆的反殖民之战)
			》
 售價:HK$ 
			653
 
 
 | 
         
          | 編輯推薦: |   
          | 适读人群:大数据挖掘算法开发者、高校和科研机构数据分析师、鲲鹏开发者 清华大学袁春教授、华为计算算法开发部 倾力出品 ·深入介绍大数据挖掘的算法原理 ·详解面向分布式计算框架的算法优化流程 ·全面分析基于鲲鹏芯片释放底层算力的实现步骤 ·详述企业级大数据算法的能优化方法 ·解析鲲鹏大数据机器学习算法库的实战应用案例 |  
         
          | 內容簡介: |   
          | 在大数据应用中,如何地挖掘数据价值是企业要解决的核心问题。为了应对这一挑战,华为推出了鲲鹏BoostKit大数据机器学习算法库,通过算法原理优化和鲲鹏芯片亲和优化,充分释放了华为鲲鹏芯片的强劲算力,大幅提升海量数据的计算能,是大数据挖掘强有力的工具。 《基于鲲鹏的大数据挖掘算法实战》主要面向大数据挖掘算法开发者,围绕鲲鹏BoostKit大数据机器学习算法库,深入介绍算法原理以及基于鲲鹏的优化实践。开发者可以通过本书实现数据挖掘入门,掌握用算法解决实际业务问题的方法和流程,了解分布式大数据挖掘算法的实现步骤,进而在鲲鹏集群中进行算法调优、二次开发或者开发新的高能算法。
 |  
         
          | 目錄: |   
          | 丛书序 前言
 第1章 大数据挖掘技术概述
 1.1 大数据技术重要性
 1.2 大数据概念和类型
 1.3 大数据挖掘技术
 1.3.1 大数据采集技术
 1.3.2 大数据预处理技术
 1.3.3 大数据分析和挖掘技术
 1.3.4 大数据可视化技术
 1.3.5 大数据应用
 1.4 大数据挖掘系统架构
 1.4.1 大数据存储系统
 1.4.2 大数据处理系统
 1.4.3 大数据可视化和应用系统
 1.5 大数据挖掘技术的性
 1.6 新技术浪潮下的大数据挖掘技术
 参考文献
 第2章 分布式开发框架
 2.1 分布式并行策略
 2.1.1 数据并行
 2.1.2 模型并行
 2.2 分布式协调
 2.2.1 ZooKeeper简介
 2.2.2 数据模型
 2.2.3 ZooKeeper体系结构
 2.2.4 分布式锁
 2.3 分布式通信
 2.3.1 分布式通信机制
 2.3.2 分布式通信拓扑
 2.4 分布式一性算法
 2.4.1 一性哈希
 2.4.2 Paxos算法
 2.4.3 Raft算法
 2.5 分布式计算框架
 2.5.1 Hadoop
 2.5.2 Spark
 2.5.3 Flink
 2.5.4 Ray
 参考文献
 第3章 挖掘算法
 3.1 主成分分析
 3.1.1 算法介绍
 3.1.2 算法推导
 3.2 线性回归
 3.2.1 线性回归的损失函数
 3.2.2 化求解方法
 3.2.3 正则化
 3.3 逻辑回归
 3.3.1 Logistic函数
 3.3.2 逻辑回归的损失函数
 3.3.3 多分类问题
 3.4 线性支持向量机
 3.4.1 支持向量机的基本概念
 3.4.2 线性支持向量机的损失函数
 3.5 决策树
 3.5.1 决策树算法概述
 3.5.2 ID3决策树算法
 3.5.3 C4.5算法
 3.5.4 分类回归树(CART)
 3.6 随机森林
 3.7 梯度提升决策树
 3.7.1 负梯度与残差
 3.7.2 GBDT的计算原理
 3.7.3 GBDT常用的损失函数
 3.8 XGBoost
 3.8.1 XGBoost预测模型
 3.8.2 目标函数
 3.8.3 XGBoost算法分析
 3.9 交替小二乘法
 3.9.1 显式反馈
 3.9.2 隐式反馈
 参考文献
 第4章 鲲鹏BoostKit大数据挖掘
 4.1 鲲鹏芯片
 4.1.1 鲲鹏芯片的发展
 4.1.2 鲲鹏920处理器
 4.1.3 鲲鹏920处理器的点
 4.2 鲲鹏BoostKit使能大数据场景
 4.2.1 鲲鹏应用使能套件BoostKit
 4.2.2 鲲鹏BoostKit大数据使能套件
 4.3 鲲鹏BoostKit大数据机器学算法库
 4.3.1 算法介绍
 4.3.2 机器学算法库的使用方法
 第5章 数据挖掘算法在鲲鹏的化实践
 5.1 主成分分析
 5.1.1 Covariance方法实现
 5.1.2 SVD方法实现
 5.1.3 鲲鹏BoostKit算法API介绍
 5.2 逻辑回归
 5.2.1 概念回顾
 5.2.2 化求解
 5.2.3 分布式实现
 5.2.4 鲲鹏BoostKit算法API介绍
 5.3 随机森林
 5.3.1 随机森林基础回顾
 5.3.2 随机森林分布式实现与化
 5.3.3 鲲鹏BoostKit算法API介绍
 5.4 XGBoost
 5.4.1 XGBoost的基础回顾
 5.4.2 XGBoost4J-Spark实现详解
 5.4.3 XGBoost单轮分布式训练实现详解
 5.4.4 鲲鹏BoostKit算法API介绍
 5.5 交替小二乘法
 5.5.1 分布式实现流程
 5.5.2 分布式实现详解
 5.5.3 鲲鹏BoostKit算法API介绍
 参考文献
 第6章 数据挖掘算法应用案例
 6.1 商品推荐案例
 6.1.1 场景介绍
 6.1.2 整体方案
 6.1.3 关键步骤
 6.1.4 小结
 6.2 房预测案例
 6.2.1 场景介绍
 6.2.2 整体方案
 6.2.3 关键步骤
 6.2.4 小结
 6.3 客户细分案例
 6.3.1 场景介绍
 6.3.2 整体方案
 6.3.3 关键步骤
 6.3.4 小结
 |    |