借助 Query 实现合并四个分公司的数据到一张表里并进一步汇总(借助元素视野寻找可疑的人)
959
2022-05-29
从本节开始,先详细介绍Elasticsearch Query DSL语法,该部分是SearchAPI的核心基础之一。
Elasticsearch提供了一个基于JSON的完整查询DSL(领域特定语言)来定义查询。把查询DSL看作是查询的AST(抽象语法树),由两种类型的子句组成:
Leaf query clauses(叶查询字句)
叶子查询子句指在特定的字段中寻找特定的值,例如匹配、范围查询或term(完全匹配)。这些查询可以单独使用。
Compound query clauses(复合查询字句)
复合查询字句包装其他叶子或复合字句,用于以逻辑方式组合多个查询(如bool、dis_max)或改变他们的行为(如常量查询)。
1、query and filter context(查询与过滤上下文)
查询子句的行为取决于它是在查询上下文中使用还是在过滤上下文中使用:
查询上下文
在查询上下文中使用的查询子句,查询字句回答了“这个文档与这个查询子句(查询条件)匹配得有多好?”除了决定文档是否匹配之外,查询子句还计算一个分数,表示相对与其他文档该文档匹配的程度。每当一个查询子句传递给查询参数(query)时,查询上下文就会生效,比如搜索API中的查询参数。
过滤上下文
在过滤上下文中,查询子句回答“这个文档是否匹配这个查询子句?”答案是简单的“是”或“否”——没有计算出分数。过滤上下文主要用于过滤结构化数据(相当与关系型数据库的过滤条件)。例如这个时间戳是否会在2015年到2016年之间?文章的状态是为“发布”吗?等等。
经常使用的过滤器(filter context)会被Elasticsearch自动缓存,以提高性能。每当一个查询子句被传递给过滤器参数(filter)时,过滤器上下文就会生效,例如bool查询中的filter或must_not参数、或filter查询中的常量查询(constant_score)或filter查询。
举例如下:
GET /_search { "query": { // @1 "bool": { // @2 "must": [ { "match": { "title": "Search" }}, // @3 { "match": { "content": "Elasticsearch" }} // @4 ], "filter": [ // @5 { "term": { "status": "published" }}, // @6 { "range": { "publish_date": { "gte": "2015-01-01" }}} // @7 ] } // end bool } // end query }
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
代码@1:query参数定义查询上下文,query参数为elasticsearch的查询上下文。
代码@2:使用elasticsearch的bool查询表达式,会在后续详细介绍。
代码@3:查询上下文,使用关键字match,表示title字段中包含"Search"字符即认为匹配。(可以类比关系型数据库 a.title like ‘%Search%’)
代码@4:查询上下文,使用关键字match,表示content字段中包含"Elasticsearch"字符即认为匹配。
代码@5:定义过滤上下文。
代码@6:使用term(完整匹配),即status字段的值是否是“published”。(相当于关系型数据库的 a.status = ‘published’)
代码@7:使用range,代表范围匹配,即publish_date字段的值是否大于等于2015-01-01。(相当于a.publish_date >= 2015-01-01’)。
下一篇将开始介绍 elasticsearch 的重头戏:查询语法。
见文如面,我是威哥,热衷于成体系剖析JAVA主流中间件,关注公众号『中间件兴趣圈』,回复专栏可获取成体系专栏导航,回复资料可以获取笔者的学习思维导图。
Elasticsearch
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。