博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Elasticsearch Mapping
阅读量:7201 次
发布时间:2019-06-29

本文共 2074 字,大约阅读时间需要 6 分钟。

1.  Mapping(映射)

Mapping 是定义文档及其包含的字段是如何存储和索引的过程

例如,我们用映射来定义:

  • 哪些字符串字段应该被当做全文字段
  • 哪些字段包含数字、日期或地理位置
  • 是否应该将文档中所有字段的值索引到catch-all字段中

1.1.  Mapping Type(映射类型)

每个索引都有一个映射类型,以决定文档将被如何索引

映射类型包含两部分:

Meta-fields

  Meta-fields通常用于自定义文档的元数据。例如,meta-fields包括文档的 _index, _type, _id, _source等字段

Fields 或 properties

  一个映射类型包含一个字段列表或属性列表

1.2.  Field datatypes(字段数据类型)

每个字段有一个数据类型,它可以是下列之一:

  • 简单类型,比如 text, keyword, date, long, double, boolean , ip
  • 支持JSON层级结构的类型,比如 object 或者 nested
  • 特别的类型,比如 geo_point, geo_shape, completion

1.3.  Example mapping

curl -X PUT "localhost:9200/my_index" -H 'Content-Type: application/json' -d'{    "mappings": {        "doc": {             "properties": {                 "title":    { "type": "text"  },                 "name":     { "type": "text"  },                 "age":      { "type": "integer" },                  "created":  {                    "type":   "date",                     "format": "strict_date_optional_time||epoch_millis"                }            }        }    }}'

创建一个索引名字叫“my_index”,并且添加一个映射类型叫“doc”,包含4个字段

2.  Field datatypes(字段类型)

2.1.  核心类型

字符串类型

  textkeyword

数值类型

  longintegershortbytedoublefloathalf_floatscaled_float

日期类型

  date

布尔类型

  boolean

二进制类型

  binary

范围类型

  integer_range float_rangelong_rangedouble_rangedate_range

2.2.  复杂类型

数组类型

  数组不需要一个专门的类型

对象类型

  object (PS:单个JSON对象)

内嵌类型

  nested(PS:JSON对象数组)

2.3.  地理类型

Geo_point类型

  geo_point 用于地理位置经纬度坐标

Geo_shape类型

  geo_shape 用于复杂形状

2.4.  专门的数据类型

IP类型

  ip (用于IPv4和IPv6地址)

Completion类型

  completion (用于自动补全提示)

Token count 类型

  token_count (用于计数字符串中的token)

mapper-murmur3

  murmur3 (计算值的hashcode,并将其存储到索引中)

过滤器类型

  接受一个查询语句

join 类型

  为同一索引内的文档定义父/子关系

3.  Meta-fields(元数据字段)

每个文档都有与之关联的元数据

3.1.  标识  元数据字段

  _index  文档属于哪个索引

  _id     文档ID

  _type    文档的映射类型

  _uid   由 _type和 _id组成的一个组合字段

3.2. 文档来源  元数据字段 

  _source  文档的原始JSON

  _size    _source字段的长度(多少字节)

3.3.  索引  元数据字段

  _all    索引其它字段的值,默认情况下是禁用的

  _field_names  所有非空字段

3.4.  路由  元数据字段

  _routing  一个自定义的路由值,用于分片的

3.5.  其它  元数据字段

  _meta   其它

4.  小结

如果把Elasticsearch比作关系型数据库的话,那么,映射就是建表,映射类型就是存储引擎,字段类型就是字段类型

转载地址:http://qfzum.baihongyu.com/

你可能感兴趣的文章
Spring事务管理(二) 声明式事务管理
查看>>
Spring思维导图,让Spring不再难懂(ioc篇)
查看>>
JVM调优之:内存分配参数
查看>>
webpack CSS LESS
查看>>
设计模式——模板方法模式
查看>>
eqweqe23
查看>>
面向对象
查看>>
javascript 添加事件兼容性处理
查看>>
Linux 目录卡死
查看>>
微服务框架Spring Cloud之使用事件和消息队列实现分布式事务
查看>>
碉堡了Ubuntu Core Linux支持 TS-4900 物联网开发板
查看>>
聊一聊啥都不会的我自学Linux系统的历程
查看>>
如何在多Kubernetes集群和多租户环境中使用Prometheus监控
查看>>
Thymeleaf教程 (十) 属性的优先级列表
查看>>
linux中 vi / vim显示行号或取消行号命令
查看>>
Python学习笔记 - 02: 用Python Client连接ElasticSearch操作数据
查看>>
2018年前端开发回顾
查看>>
微信小程序访问webService(Java)
查看>>
QT从QObject实现多重继承
查看>>
DelayQueue实现Java延时任务
查看>>