登入帳戶  | 訂單查詢  | 購物車/收銀台(0) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入   新用戶註冊
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2025年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / 物流,時效:出貨後2-4日

2026年01月出版新書

2025年12月出版新書

2025年11月出版新書

2025年10月出版新書

2025年09月出版新書

2025年08月出版新書

2025年07月出版新書

2025年06月出版新書

2025年05月出版新書

2025年04月出版新書

2025年03月出版新書

2025年02月出版新書

2025年01月出版新書

2024年12月出版新書

『簡體書』大数据与云计算

書城自編碼: 4179466
分類: 簡體書→大陸圖書→教材研究生/本科/专科教材
作者: 杨良怀,胡海根,范玉雷
國際書號(ISBN): 9787030804532
出版社: 科学出版社
出版日期:

頁數/字數: /
釘裝: 平装

售價:NT$ 352

我要買

** 我創建的書架 **
未登入.



新書推薦:
你的代谢还好吗:控制“五高”饮食运动法
《 你的代谢还好吗:控制“五高”饮食运动法 》

售價:NT$ 254
战国史料编年辑证(全二册)(杨宽著作集)
《 战国史料编年辑证(全二册)(杨宽著作集) 》

售價:NT$ 1265
流动的世界想象:中国当代电影与视觉文化
《 流动的世界想象:中国当代电影与视觉文化 》

售價:NT$ 347
传播与帝国:1860—1930 年的媒体、市场与全球化(跨洲史料详尽呈现全球通信全景,资本视角重新定
《 传播与帝国:1860—1930 年的媒体、市场与全球化(跨洲史料详尽呈现全球通信全景,资本视角重新定 》

售價:NT$ 458
不再为他人而活:接纳自我的阿德勒心理学
《 不再为他人而活:接纳自我的阿德勒心理学 》

售價:NT$ 301
马可波罗和他的世界 蒙古世纪全球史陆海书系
《 马可波罗和他的世界 蒙古世纪全球史陆海书系 》

售價:NT$ 398
更生:中国文明与人文精神重塑
《 更生:中国文明与人文精神重塑 》

售價:NT$ 755
四海之内:中国历史四十讲
《 四海之内:中国历史四十讲 》

售價:NT$ 454

內容簡介:
大数据开启了一次重大的时代转型,云计算为大数据提供了技术支撑。《大数据与云计算》是大数据与云计算领域的入门教材,内容上尽量做到系统而完整地涵盖大数据及云计算的多个方面,理论与实际相结合。在基础理论方面介绍大数据计算范式、云计算、虚拟化技术与分布式一致性算法;并基于此,围绕大数据的存储、管理、处理和分析需求,讲述大数据处理的开源平台Hadoop生态系统,涉及分布式存储系统与大数据计算框架。分布式存储系统包括分布式文件系统HDFS、键值数据库系统HBase与分布式数据仓库Hive;大数据计算框架包括批处理/微批处理框架、流式处理框架及图计算框架GraphX。此外,《大数据与云计算》还介绍大数据计算理论及其应用实例,内容包括高维数据特性、亚线性算法设计理论与方法、亚线性算法应用。
目錄
目录第1章 引言 11.1 大数据概述 11.1.1 大数据的发展 11.1.2 大数据的定义及特征 21.1.3 大数据系统参考架构的设计与分析 51.1.4 数据科学与工程 101.1.5 大数据技术面临的挑战 121.2 云计算概述 131.2.1 云计算的五个基本特征 151.2.2 云计算的三种服务模式 161.2.3 云计算的四种部署类型 17小结 19习题 19第2章 虚拟化技术 202.1 概述 202.2 虚拟化原理 212.2.1 计算机系统的分层抽象 212.2.2 虚拟化机制 232.3 系统虚拟化 262.3.1 虚拟机分类 312.3.2 虚拟机技术分类 362.4 存储虚拟化 402.4.1 块虚拟化 412.4.2 文件系统虚拟化 412.4.3 文件虚拟化 422.4.4 基于主机的存储虚拟化 422.4.5 存储设备/子系统虚拟化 422.4.6 基于网络的存储虚拟化 432.5 网络虚拟化 43小结 46习题 46第3章 Hadoop及其生态系统 473.1 概述 473.2 Hadoop 493.2.1 Hadoop 1 493.2.2 Hadoop 2 503.2.3 Hadoop 3 503.2.4 Hadoop的安装 533.3 YARN——Hadoop的分布式操作系统 583.3.1 YARN的体系架构 593.3.2 资源管理器功能 613.3.3 应用主控器功能 633.3.4 节点管理器功能 633.3.5 调度策略 643.4 Hadoop生态系统 663.4.1 数据采集组件 673.4.2 数据存储与管理组件 683.4.3 大数据批处理系统 693.4.4 大数据交互式分析系统 693.4.5 图处理系统 703.4.6 大数据流处理系统 703.4.7 大数据流水线框架 703.4.8 其他组件及工具 70小结 71习题 71第4章 分布式一致性算法 724.1 概述 724.2 两/三阶段提交协议 744.2.1 两阶段提交协议 744.2.2 三阶段提交协议 774.3 Paxos算法 804.3.1 提案批准 824.3.2 决议获知 874.3.3 活性 874.3.4 实现 884.4 CAP理论 894.4.1 ACID与BASE关系 904.4.2 CAP与ACID的关系 924.4.3 CAP和延迟的联系 934.4.4 系统设计中CAP权衡 934.5 ZooKeeper 954.5.1 ZooKeeper分布式协调系统 954.5.2 ZooKeeper实现 1004.5.3 ZooKeeper安装与使用 103小结 106习题 106第5章 分布式文件系统HDFS 1075.1 概述 1075.1.1 分布式文件系统的功能 1075.1.2 分布式文件系统发展的三个阶段 1095.1.3 分布式文件系统架构的演化 1105.2 Hadoop分布式文件系统 1115.2.1 HDFS的设计目标 1115.2.2 文件与块 1125.2.3 HDFS架构 1125.2.4 HDFS数据副本放置策略 1145.2.5 HDFS的读写机制 1155.2.6 HDFS元数据的持久化 1175.2.7 HDFS容错机制 1185.2.8 HDFS的使用 1205.3 HDFS高可用性机制 1215.4 HDFS联邦 124小结 126习题 126第6章 分布式键值数据库系统HBase 1276.1 分布式数据库系统概述 1276.1.1 数据管理发展简史 1276.1.2 数据库系统扩展概述 1286.1.3 分片 1286.1.4 复制 1296.2 HBase概述 1306.2.1 HBase发展简史 1306.2.2 HBase和传统关系数据库系统的区别 1306.2.3 HBase简介 1316.2.4 HBase适用场景 1316.3 HBase体系结构 1326.3.1 HBase架构图 1326.3.2 HBase分区组织结构 1346.3.3 HBase预分区设计 1356.3.4 HBase寻址机制 1366.3.5 HBase内部读写机制 1376.4 HBase一致性 1386.4.1 强一致性HBase 1386.4.2 HBase强一致性和HDFS多副本 1396.5 HBase数据模型 1396.5.1 HBase数据模型的基本概念 1396.5.2 HBase逻辑模型 1406.5.3 HBase物理模型 1406.5.4 HBase数据库设计 1416.5.5 HBase数据表特点 1426.6 HBase的安装和使用 1436.6.1 软件与环境 1436.6.2 HBase的安装与配置 1436.6.3 HBase数据表在Shell终端下的操作 1456.6.4 HBase客户端API 1456.6.5 HBase可用客户端 146小结 147习题 147第7章 数据仓库系统Hive 1487.1 数据仓库概述 1487.1.1 数据仓库的定义和特征 1487.1.2 数据仓库的概念模型 1507.1.3 数据仓库的逻辑模型 1517.1.4 数据仓库的物理模型 1547.1.5 数据仓库设计 1567.1.6 数据仓库Hive简介 1567.2 数据仓库Hive的体系结构 1577.2.1 用户接口及Thrift服务 1587.2.2 数据仓库Hive引擎及元数据库 1587.2.3 数据存储和计算 1597.2.4 数据仓库Hive的总体工作流程 1617.2.5 数据仓库Hive的优劣势及应用场景 1627.3 Hive的安装 1627.4 HQL 1647.4.1 Hive数据定义 1657.4.2 Hive数据操纵 1697.4.3 Hive视图 1727.4.4 Hive索引 173小结 173习题 174第8章 批处理计算框架MapReduce 1758.1 MapReduce发展简史 1758.2 MapReduce计算模型 1758.2.1 MapReduce简介 1758.2.2 map函数 1768.2.3 reduce函数 1788.3 MapReduce内部工作机制 1838.3.1 MapReduce v1 1838.3.2 MapReduce v2 1868.4 MapReduce编程实例 189小结 191习题 191第9章 微批量计算框架Spark 1939.1 Spark概述 1939.1.1 Spark生态系统 1939.1.2 Spark运行框架 1959.1.3 Spark的安装与运行示例 1969.2 RDD 1979.2.1 RDD概述 1979.2.2 RDD的运行原理 1979.3 Spark的存储 2049.3.1 存储层架构 2049.3.2 混洗数据持久化 2049.3.3 RDD持久化 2059.3.4 广播变量持久化 2079.3.5 TachyonStore 2079.4 Spark的作业提交与执行 2079.5 Spark运行模式 2089.6 Spark的容错原理 2109.7 RDD编程实例 2119.8 结构化API 212小结 214习题 215第10章 流式计算框架 21610.1 流式计算概述 21610.1.1 概念 21610.1.2 流式计算原理 21710.1.3 应用场景 21810.2 Storm 21810.2.1 Storm的架构与工作流程 21910.2.2 拓扑运行原理 22010.2.3 实践 22210.3 Spark Streaming 22810.3.1 工作原理 22810.3.2 基本概念 22910.3.3 持久化、容错和性能调优 23310.3.4 程序设计实例 23410.4 Flink 23810.4.1 Flink的工作原理 23810.4.2 Flink中对时间的处理 24010.4.3 Flink的应用程序接口 24110.4.4 程序设计实例 242小结 245习题 245第11章 图计算框架 24611.1 图计算概述 24611.2 图分割 24711.3 图计算模型 24711.3.1 顶点中心计算模型 24711.3.2 边中心计算模型 25211.3.3 路径中心计算模型 25311.3.4 子图中心计算模型 25311.4 GraphX计算框架 25311.4.1 GraphX编程原理 25411.4.2 GraphX编程实例 261小结 263习题 263第12章 大数据计算理论及应用 26412.1 概述 26412.2 高维数据 26412.2.1 认识高维球体 26712.2.2 高维空间采样 26912.2.3 大数据归约方法 27212.3 亚线性计算理论 27312.3.1 基本概念 27312.3.2 不等式和界 27812.4 亚线性算法应用 28312.4.1 空间亚线性算法 28312.4.2 时间亚线性算法 28812.4.3 相似文档归类 290小结 295习题 295参考文献 296

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 台灣用户 | 香港/海外用户
megBook.com.tw
Copyright (C) 2013 - 2026 (香港)大書城有限公司 All Rights Reserved.