ElasticSearch 如何配置某个字段的权重?

1年前 (2023) 程序员胖胖胖虎阿
118 0 0

松哥原创的 Spring Boot 视频教程已经杀青,感兴趣的小伙伴戳这里-->Spring Boot+Vue+微人事视频教程


上篇文章我们分享了 ElasticSearch 的 analyzer、search_analyzer 以及 normalizer 三种映射参数,今天我们还是这个话题,来看接下来的五个映射参数。

本文是ElasticSearch 系列第 15 篇,和大家聊一聊索引的基本操作,前 14 篇传送门:

  1. 打算出一个 ElasticSearch 教程,谁赞成,谁反对?
  2. ElasticSearch 从安装开始
  3. ElasticSearch 第三弹,核心概念介绍
  4. ElasticSearch 中的中文分词器该怎么玩?
  5. ElasticSearch 索引基本操作
  6. ElasticSearch 文档的添加、获取以及更新
  7. ElasticSearch 文档的删除和批量操作
  8. ElasticSearch 文档路由,你的数据到底存在哪一个分片上?
  9. ElasticSearch 并发的处理方式:锁和版本控制
  10. ElasticSearch 中的倒排索引到底是什么?
  11. ElasticSearch 动态映射与静态映射
  12. ElasticSearch 四种字段类型详解
  13. ElasticSearch 中的地理类型和特殊类型
  14. ElasticSearch 23 种映射参数详解

boost、coerce 与 copy_to 参数:

dov_values 和 fielddata 参数:

如果大家觉得视频风格还能接受,也可以看看松哥的付费视频:Spring Boot+Vue+微人事视频教程

以下是视频笔记:

注意,笔记只是视频内容的一个简要记录,因此笔记内容比较简单,完整的内容可以查看视频。

11.4 boost

boost 参数可以设置字段的权重。

boost 有两种使用思路,一种就是在定义 mappings 的时候使用,在指定字段类型时使用;另一种就是在查询时使用。

实际开发中建议使用后者,前者有问题:如果不重新索引文档,权重无法修改。

mapping 中使用 boost(不推荐):

PUT blog
{
  "mappings": {
    "properties": {
      "content":{
        "type""text",
        "boost": 2
      }
    }
  }
}

另一种方式就是在查询的时候,指定 boost

GET blog/_search
{
  "query": {
    "match": {
      "content": {
        "query""你好",
        "boost": 2
      }
    }
  }
}

11.5 coerce

coerce 用来清除脏数据,默认为 true。

例如一个数字,在 JSON 中,用户可能写错了:

{"age":"99"}

或者 :

{"age":"99.0"}

这些都不是正确的数字格式。

通过 coerce 可以解决该问题。

默认情况下,以下操作没问题,就是 coerce 起作用:

PUT blog
{
  "mappings": {
    "properties": {
      "age":{
        "type""integer"
      }
    }
  }
}

POST blog/_doc
{
  "age":"99.0"
}

如果需要修改 coerce ,方式如下:

PUT blog
{
  "mappings": {
    "properties": {
      "age":{
        "type""integer",
        "coerce"false
      }
    }
  }
}

POST blog/_doc
{
  "age":99
}

当 coerce 修改为 false 之后,数字就只能是数字了,不可以是字符串,该字段传入字符串会报错。

11.6 copy_to

这个属性,可以将多个字段的值,复制到同一个字段中。

定义方式如下:

PUT blog
{
  "mappings": {
    "properties": {
      "title":{
        "type""text",
        "copy_to""full_content"
      },
      "content":{
        "type""text",
        "copy_to""full_content"
      },
      "full_content":{
        "type""text"
      }
    }
  }
}

PUT blog/_doc/1
{
  "title":"你好江南一点雨",
  "content":"当 coerce 修改为 false 之后,数字就只能是数字了,不可以是字符串,该字段传入字符串会报错。"
}

GET blog/_search
{
  "query": {
    "term": {
      "full_content""当"
    }
  }
}

11.7 doc_values 和 fielddata

es 中的搜索主要是用到倒排索引,doc_values 参数是为了加快排序、聚合操作而生的。当建立倒排索引的时候,会额外增加列式存储映射。

doc_values 默认是开启的,如果确定某个字段不需要排序或者不需要聚合,那么可以关闭 doc_values。

大部分的字段在索引时都会生成 doc_values,除了 text。text 字段在查询时会生成一个 fielddata 的数据结构,fieldata 在字段首次被聚合、排序的时候生成。

ElasticSearch 如何配置某个字段的权重?

doc_values 默认开启,fielddata 默认关闭。

doc_values 演示:

PUT users

PUT users/_doc/1
{
  "age":100
}

PUT users/_doc/2
{
  "age":99
}

PUT users/_doc/3
{
  "age":98
}

PUT users/_doc/4
{
  "age":101
}

GET users/_search
{
  "query": {
    "match_all": {}
  },
  "sort":[
    {
      "age":{
        "order""desc"
      }
    }
    ]
}

由于 doc_values 默认时开启的,所以可以直接使用该字段排序,如果想关闭 doc_values ,如下:

PUT users
{
  "mappings": {
    "properties": {
      "age":{
        "type""integer",
        "doc_values"false
      }
    }
  }
}

PUT users/_doc/1
{
  "age":100
}

PUT users/_doc/2
{
  "age":99
}

PUT users/_doc/3
{
  "age":98
}

PUT users/_doc/4
{
  "age":101
}

GET users/_search
{
  "query": {
    "match_all": {}
  },
  "sort":[
    {
      "age":{
        "order""desc"
      }
    }
    ]
}






往期推荐
0
1

50+ 需求文档免费下载!

0
2

Spring Security 教程合集

0
3

接了两个私活,都是血汗钱

ElasticSearch 如何配置某个字段的权重?

本文分享自微信公众号 - 江南一点雨(a_javaboy)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

版权声明:程序员胖胖胖虎阿 发表于 2023年8月30日 下午1:24。
转载请注明:ElasticSearch 如何配置某个字段的权重? | 胖虎的工具箱-编程导航

相关文章

暂无评论

暂无评论...