新書推薦:
《
世界巨变:严复的角色(王中江著作系列)
》
售價:NT$
500.0
《
塔西佗(全二册)(二十世纪人文译丛)
》
售價:NT$
1800.0
《
(棱镜精装人文译丛)思想的假死
》
售價:NT$
290.0
《
当代精神分析新论
》
售價:NT$
430.0
《
宋初三先生集(中国思想史资料丛刊)
》
售價:NT$
990.0
《
棕榈油的全球史 : 从奴隶船到购物篮
》
售價:NT$
440.0
《
简帛时代与早期中国思想世界(上下册)(王中江著作系列)
》
售價:NT$
1400.0
《
进化主义在中国的兴起(王中江著作系列)
》
售價:NT$
950.0
|
編輯推薦: |
Elasticsearch是基于Lucene的新一代分布式、RESTful风格的开源搜索引擎,具有实时搜索、稳定、快速、安装使用方便等优点。Elasticsearch在全球拥有众多知名用户:GitHub使用Elasticsearch搜索20 TB的数据——包括13亿文件和1300亿行代码,有“音频分享界YouTube”之称的SoundCloud使用Elasticsearch为1.8亿会员在线即时提供音频搜索结果,德国商务社交网站Xing使用Elasticsearch为1400万会员提供可扩展、实时的搜索,手机服务网站Foursquare使用Elasticsearch实时搜索5000万个地点,浏览器插件StumbleUpon利用Elasticsearch每天向它们的社区发送数百万条推荐。
|
內容簡介: |
本书介绍了Elasticsearch这个优秀的全文检索和分析引擎从安装和配置到集群管理的各方面知识。本书这一版不仅补充了上一版中遗漏的重要内容,并且所有示例和功能均基于Elasticsearch服务器1.0版进行了更新。你可以从头开始循序渐进地学习本书,也可以查阅具体功能解决手头问题。
|
關於作者: |
Rafa Ku
?
solr.pl网站联合创始人,现为Sematext集团顾问和软件工程师,专注于Apache Lucene、Solr、Elasticsearch和Hadoop等开源技术。Rafa拥有超过12年的多领域软件经验,其中既包括银行软件又包括电子商务产品。Rafa也是Apache Solr 3.1 Cookbook等技术图书的作者,并且一直是Lucene Eurocon、Berlin Buzzwords、ApacheCon和Lucene Revolution等会议的演讲嘉宾。
Marek Rogoziński
solr.pl网站联合创始人,拥有10年以上的软件架构师和顾问从业经验,专门研究基于Solr和Elasticsearch等开源搜索引擎的解决方案,以及Hadoop、HBase和Twitter Storm等用于大数据分析的软件。
译者简介:
蔡建斌
敏捷践行者,擅长ScrumXPKanban等敏捷实践,现在英孚教育全球研发中心任Technical Lead,除了50%时间写代码以外,业务需求分析、前后端架构设计、性能调优、自动化测试、流程改进、发布运维、代码评审……无所不为,只为开发出更好的软件。爱好围棋,弈城4段5段之间跳跃。目标:工作上有所不为;爱好上添加一项健身。Email:caijianbin93@126.com。
|
目錄:
|
第1 章 Elasticsearch集群入门
1.1 全文检索
1.1.1 Lucene词汇表和架构
1.1.2 输入数据分析
1.1.3 评分和查询相关性
1.2 Elasticsearch基础
1.2.1 数据架构的主要概念
1.2.2 Elasticsearch主要概念
1.2.3 索引建立和搜索
1.3 安装并配置集群
1.3.1 安装Java
1.3.2 安装Elasticsearch
1.3.3 在Linux 上用二进制包安装Elasticsearch
1.3.4 目录布局
1.3.5 配置Elasticsearch
1.3.6 运行Elasticsearch
1.3.7 关掉Elasticsearch
1.3.8 Elasticsearch作为系统服务运行
1.4 用REST API操作数据
1.4.1 理解Elasticsearch的RESTfulAPI
1.4.2 在Elasticsearch中存储数据
1.4.3 新建文档
1.4.4 检索文档
1.4.5 更新文档
1.4.6 删除文档
1.4.7 版本控制
1.5 使用URI请求查询来搜索
1.5.1 示例数据
1.5.2 URI 请求
1.5.3 Lucene查询语法
1.6 小结
第2 章 索引
2.1 Elasticsearch索引
2.1.1 分片和副本
2.1.2 创建索引
2.2 映射配置
2.2.1 类型确定机制
2.2.2 索引结构映射
2.2.3 不同的相似度模型
2.2.4 信息格式
2.2.5 文档值
2.3 批量索引以提高索引速度
2.3.1 为批量索引准备数据
2.3.2 索引数据
2.3.3 更快的批量请求
2.4 用附加的内部信息扩展索引结构
2.4.1 标识符字段
2.4.2 _type字段
2.4.3 _all字段
2.4.4 _source字段
2.4.5 _index字段
2.4.6 _size字段
2.4.7 _timestamp字段
2.4.8 _ttl字段
2.5 段合并介绍
2.5.1 段合并
2.5.2 段合并的必要性
2.5.3 合并策略
2.5.4 合并调度器
2.5.5 合并因子
2.5.6 调节
2.6 路由介绍
2.6.1 默认索引过程
2.6.2 默认搜索过程
2.6.3 路由
2.6.4 路由参数
2.6.5 路由字段
2.7 小结
第3 章 搜索
3.1 查询Elasticsearch
3.1.1 示例数据
3.1.2 简单查询
3.1.3 分页和结果集大小
3.1.4 返回版本值
3.1.5 限制得分
3.1.6 选择需要返回的字段
3.1.7 使用脚本字段
3.2 理解查询过程
3.2.1 查询逻辑
3.2.2 搜索类型
3.2.3 搜索执行偏好
3.2.4 搜索分片API
3.3 基本查询
3.3.1 词条查询
3.3.2 多词条查询
3.3.3 match_all查询
3.3.4 常用词查询
3.3.5 match查询
3.3.6 multi_match查询
3.3.7 query_string查询
3.3.8 simple_query_string查询
3.3.9 标识符查询
3.3.10 前缀查询
3.3.11 fuzzy_like_this查询
3.3.12 fuzzy_like_this_field查询
3.3.13 fuzzy 查询
3.3.14 通配符查询
3.3.15 more_like_this查询
3.3.16 more_like_this_filed查询
3.3.17 范围查询
3.3.18 最大分查询
3.3.19 正则表达式查询
3.4 复合查询
3.4.1 布尔查询
3.4.2 加权查询
3.4.3 constant_score查询
3.4.4 索引查询
3.5 查询结果的过滤
3.5.1 使用过滤器
3.5.2 过滤器类型
3.5.3 过滤器的缓存
3.6 高亮显示
3.6.1 高亮显示入门
3.6.2 字段配置
3.6.3 深入底层
3.6.4 配置HTML标签
3.6.5 控制高亮片段
3.6.6 全局设置与局部设置
3.6.7 需要匹配
3.6.8 信息高亮器
3.7 验证查询
3.8 数据排序
3.8.1 默认排序
3.8.2 选择用于排序的字段
3.8.3 指定缺少字段的行为
3.8.4 动态条件
3.8.5 排序规则和国家特有字符
3.9 查询重写
3.9.1 重写过程示例
3.9.2 查询重写的属性
3.10 小结
第4 章 扩展索引结构
4.1 索引树形结构
4.1.1 数据结构
4.1.2 分析
4.2 索引非扁平数据
4.2.1 数据
4.2.2 对象
4.2.3 数组
4.2.4 映射
4.2.5 向Elasticsearch发送映射
4.2.6 动态还是非动态
4.3 使用嵌套对象
4.4 使用父子关系
4.4.1 索引结构和数据索引
4.4.2 查询
4.4.3 父子关系和过滤
4.4.4 性能考虑
4.5 使用更新API修改索引结构
4.5.1 映射
4.5.2 添加一个新字段
4.5.3 修改字段
4.6 小结
第5 章 更好的搜索
5.1 Apache Lucene评分简介
5.1.1 当文档被匹配时
5.1.2 默认评分公式
5.1.3 相关性的意义
5.2 Elasticsearch的脚本功能
5.2.1 脚本执行过程中可用的对象
5.2.2 MVEL
5.2.3 使用其他语言
5.2.4 使用自定义脚本库
5.3 搜索不同语言的内容
5.3.1 区分处理不同语言
5.3.2 多语言处理
5.3.3 检测文档的语言
5.3.4 示例文档
5.3.5 映射文件
5.3.6 查询
5.4 使用查询加权影响得分
5.4.1 加权
5.4.2 为查询添加加权
5.4.3 修改得分
5.5 索引时加权何时有意义
5.5.1 在输入数据中定义字段加权
5.5.2 在映射中定义加权
5.6 同义词
5.6.1 同义词过滤器
5.6.2 定义同义词规则
5.6.3 查询时或索引时的同义词扩展
5.7 理解解释信息
5.7.1 理解字段分析
5.7.2 解释查询
5.8 小结
第6 章 超越全文检索
6.1 聚合
6.1.1 一般查询结构
6.1.2 可用的聚合
6.1.3 聚合的嵌套
6.1.4 桶排序和嵌套聚合
6.1.5 全局和子集
6.2 切面
6.2.1 文档结构
6.2.2 返回的结果
6.2.3 使用查询进行切面计算
6.2.4 使用过滤器进行切面计算
6.2.5 terms切面
6.2.6 基于范围的切面
6.2.7 数值和日期直方图切面
6.2.8 数值型字段统计数据的计算
6.2.9 词条统计数据的计算
6.2.10 地理切面
6.2.11 切面结果的过滤
6.2.12 内存考虑
6.3 使用建议器
6.3.1 可用的建议器类型
6.3.2 包含建议器
6.3.3 term建议器
6.3.4 phrase建议器
6.3.5 completion建议器
6.4 预匹配器
6.4.1 示例索引
6.4.2 预匹配器的准备
6.4.3 深入
6.5 文件的处理
6.6 地理
6.6.1 为空间搜索准备映射
6.6.2 示例数据
6.6.3 示例查询
6.6.4 任意地理形状
6.7 卷动API
6.7.1 问题定义
6.7.2 作为解决方案的卷动
6.8 多词条过滤器
6.9 小结
第7 章 深入Elasticsearch集群
7.1 节点发现
7.1.1 发现的类型
7.1.2 主节点
7.1.3 设置集群名
7.1.4 节点的ping设置
7.2 时光之门与恢复模块
7.2.1 时光之门
7.2.2 恢复控制
7.3 为高查询和高索引吞吐量准备Elasticsearch集群
7.3.1 过滤器缓存
7.3.2 字段数据缓存和断路器
7.3.3 存储模块
7.3.4 索引缓冲和刷新率
7.3.5 线程池的配置
7.3.6 结合起来,一些通用建议
7.4 模板和动态模板
7.4.1 模板
7.4.2 动态模板
7.5 小结
第8 章 集群管理
8.1 Elasticsearch时光机
8.1.1 创建快照存储库
8.1.2 创建快照
8.1.3 还原快照
8.1.4 清理:删除旧的快照
8.2 监控集群的状态和健康度
8.2.1 集群健康度API
8.2.2 索引统计API
8.2.3 状态API
8.2.4 节点信息API
8.2.5 节点统计API
8.2.6 集群状态API
8.2.7 挂起任务API
8.2.8 索引段API
8.2.9 cat API
8.3 控制集群的再平衡
8.3.1 再平衡
8.3.2 集群的就绪
8.3.3 集群再平衡设置
8.4 控制分片和副本的分配
8.4.1 显式控制分配
8.4.2 集群范围的分配
8.4.3 每个节点上的分片和副本数量
8.4.4 手动移动分片和副本
8.5 预热
8.5.1 定义一个新的预热查询
8.5.2 获取定义的预热查询
8.5.3 删除一个预热查询
8.5.4 禁用预热功能
8.5.5 查询的选择
8.6 使用索引别名来简化你的日常工作
8.6.1 别名
8.6.2 创建别名
8.6.3 修改别名
8.6.4 合并命令
8.6.5 获取所有别名
8.6.6 移除别名
8.6.7 别名中的过滤
8.6.8 别名和路由
8.7 Elasticsearch插件
8.7.1 基础知识
8.7.2 安装插件
8.7.3 移除插件
8.8 更新设置API
8.9 小结
|
|