ElasticSearch 文档路由，你的数据到底存在哪一个分片上？

2年前 (2022) 程序员胖胖胖虎阿

196 0 0

松哥原创的 Spring Boot 视频教程已经杀青，感兴趣的小伙伴戳这里-->Spring Boot+Vue+微人事视频教程

ElasticSearch 系列第八篇，和大家聊一聊索引的基本操作，前七篇传送门：

打算出一个 ElasticSearch 教程，谁赞成，谁反对？
ElasticSearch 从安装开始
ElasticSearch 第三弹，核心概念介绍
ElasticSearch 中的中文分词器该怎么玩？
ElasticSearch 索引基本操作
ElasticSearch 文档的添加、获取以及更新
ElasticSearch 文档的删除和批量操作

以下是视频笔记：

注意，笔记只是视频内容的一个简要记录，因此笔记内容比较简单，完整的内容可以查看视频。

es 是一个分布式系统，当我们存储一个文档到 es 上之后，这个文档实际上是被存储到 master 节点中的某一个主分片上。

例如新建一个索引，该索引有两个分片，0个副本，如下：

接下来，向该索引中保存一个文档：

PUT blog/_doc/a
{
  "title":"a"
}

文档保存成功后，可以查看该文档被保存到哪个分片中去了：

GET _cat/shards/blog?v

查看结果如下：

index shard prirep state   docs store ip        node
blog  1     p      STARTED    0  208b 127.0.0.1 slave01
blog  0     p      STARTED    1 3.6kb 127.0.0.1 master

从这个结果中，可以看出，文档被保存到分片 0 中。

那么 es 中到底是按照什么样的规则去分配分片的？

es 中的路由机制是通过哈希算法，将具有相同哈希值的文档放到一个主分片中，分片位置的计算方式如下：

shard=hash(routing) % number_of_primary_shards

routing 可以是一个任意字符串，es 默认是将文档的 id 作为 routing 值，通过哈希函数根据 routing 生成一个数字，然后将该数字和分片数取余，取余的结果就是分片的位置。

默认的这种路由模式，最大的优势在于负载均衡，这种方式可以保证数据平均分配在不同的分片上。但是他有一个很大的劣势，就是查询时候无法确定文档的位置，此时它会将请求广播到所有的分片上去执行。另一方面，使用默认的路由模式，后期修改分片数量不方便。

当然开发者也可以自定义 routing 的值，方式如下：

PUT blog/_doc/d?routing=javaboy
{
  "title":"d"
}

如果文档在添加时指定了 routing，则查询、删除、更新时也需要指定 routing。

GET blog/_doc/d?routing=javaboy

自定义 routing 有可能会导致负载不均衡，这个还是要结合实际情况选择。

典型场景：

对于用户数据，我们可以将 userid 作为 routing，这样就能保证同一个用户的数据保存在同一个分片中，检索时，同样使用 userid 作为 routing，这样就可以精准的从某一个分片中获取数据。

今日干货

刚刚发表

查看:
13500
回复:135

公众号后台回复 2TB，免费获取 2TB Java 学习资料。

本文分享自微信公众号 - 江南一点雨（a_javaboy）。
如有侵权，请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”，欢迎正在阅读的你也加入，一起分享。

版权声明：程序员胖胖胖虎阿发表于 2022年11月10日下午3:00。
转载请注明：ElasticSearch 文档路由，你的数据到底存在哪一个分片上？ | 胖虎的工具箱-编程导航

【Vegas原创】win7下打开telnet服务

程序员胖胖胖虎阿

289

java static 详解

程序员胖胖胖虎阿

264

IntelliJ IDEA永久破解码(IDEA全新破解教程,激活至2099年)

程序员胖胖胖虎阿

280

IDEA专业版注册码(IntelliJ IDEA最新版激活码,亲测有效!!)

程序员胖胖胖虎阿

277

IntelliJ IDEA2020激活码(IDEA正版破解版绝对有效)

程序员胖胖胖虎阿

213

【JavaEE初阶】多线程 _ 基础篇 _ 线程安全问题（上篇）

程序员胖胖胖虎阿

180

暂无评论

暂无评论...

ElasticSearch 文档路由，你的数据到底存在哪一个分片上？

IntelliJ IDEA永久破解插件(IntelliJ IDEA2022破解方法每日更新)

[算法数据结构] 关于回溯算法的理解记录

相关文章

暂无评论