ElasticSearch <a target="_blank" href="https://www.huoban.com/news/tags-2004.html"style="font-weight:bold;">全文</a><a target="_blank" href="https://www.huoban.com/news/tags-2005.html"style="font-weight:bold;">检索</a>

ElasticSearch 全文检索_ElasticSearch 优化

网友投稿 912 2025-04-04

elasticsearch 优化（1）-集群脑裂问题

elasticsearch 优化（2）

调大系统的“最大打开文件数”,建议32K甚至是64K

ulimit -a (查看)

ulimit -n 32000(设置)

ElasticSearch 优化（3）

修改配置文件调整ES的JVM内存大小

1）修改bin/elasticsearch.in.sh中ES_MIN_MEM和ES_MAX_MEM的大小，建议设置一样大，避免频繁的分配内存。根据服务器内存大小，一般分配60%左右(默认256M)

2）内存最大不要超过32G（详细内容见链接）

ElasticSearch 优化（4）

设置memory_lock来锁定进程的物理内存地址

避免内存交换（swapped）来提高性能

修改文件

vi config/elasticsearch.yml

bootstrap.mlockall: true（2.4.0以前）

bootstrap.memory_lock: true（2.4.3之后）

ElasticSearch 优化（5）

适当增大分片，可以提升建立索引的能力，5-20个比较合适。

如果分片数过少或过多，都会导致检索比较慢。

1）分片数过多，会导致检索时打开文件较多，另外也会导致多台服务器之间通讯，影响效率。

2）分片数过少会导至单个分片索引过大，所以检索速度慢。

3）建议单个分片最多存储20G左右的索引数据，通用计算公式：分片数量=数据总量/20G

ElasticSearch 优化（6）

合理设置副本数

1）增加副本，可以提升搜索的能力。

2）如果副本设置过多，会对服务器造成额外的压力，因为主分片需要给所有副本同步数据。另外，副本过多也会占用磁盘空间。

3）一般建议最多设置2-3个即可

ElasticSearch 优化（7）

定时对索引进行合并优化，segment越多，占用的segment memory越多，查询的性能也越差。

1）索引量不大的情况下，可以将segment设置为1。

2）在es2.1.0以前调用_optimize接口，后期改为_forcemerge接口。

curl -XPOST 'http://master:9200/dwq2/_forcemerge?max_num_segments=1'

client.admin().indices().prepareForceMerge("dwq").setMaxNumSegments(1).get();

ElasticSearch 优化（8）

针对不使用的index，建议close，减少内存占用。

只要索引处于open状态，索引库中的segement就会占用内存，close之后就只会占用磁盘空间不会占用内存。

curl -XPOST 'master:9200/dwq/_close'

ElasticSearch 优化（9）

清除删除文档

在Lucene中删除文档，数据不会马上在硬盘上清除，而是在lucene索引中产生一个.del的文件，然而在检索过程中这部分数据也会参与检索，lucene在检索过程会判断是否删除，如果已经删除，再过滤掉，这样也会降低检索效率。

可以执行清除删除文档命令：

curl -XPOST 'http://master:9200/dwq/_optimize?only_expunge_deletes=true'

client.admin().indices().prepareOptimize("dwq").setOnlyExpungeDeletes(true).get();

ElasticSearch 优化（10）

优化ES数据导入:

1）如果在项目开始阶段，需要批量入库大量数据，建议将副本数设置为0。因为es在索引数据的时候，如果副本已经存在，数据会立即同步到副本中，这样会对es增加压力。

2）等到索引完成后，再恢复副本数即可，可以提高索引效率。

ElasticSearch 全文检索_ElasticSearch 优化

curl -XGET http://master:9200/dwq/_settings?pretty

curl -XPUT 'http://master:9200/dwq/_settings' -d

'{"index":{"number_of_replicas":0}}'

curl -XPUT 'http://master:9200/dwq/_settings' -d

'{"index":{"number_of_replicas":1}}'

ElasticSearch 优化（11）

优化ES索引_all

去掉mapping中_all域，Index中默认会有_all的域，虽然会给查询带来方便，但是会增加索引时间和索引尺寸。

ElasticSearch 优化（12）

优化ES索引_source

_source字段我在们进行检索时相当重要。

ES默认检索只会返回ID，如果在{"enabled":false}情况下，你需通过根据这个ID去去倒排索引中去取每个Field数据，效率不高。

而反之，在{"enabled":true}的情况下可以根据ID直接检索对应source JSON的字段，不用去倒排索引去按Field取数据。

ElasticSearch 优化（13）

ES优化:

1）使用java代码操作es集群,要保证本地es的版本和集群上es的版本保持一致。

2）保证集群中每个节点的JDK版本和es配置一致。

全文检索 Elasticsearch 实时流计算服务 CS

ELK 设置定时清理脚本清理索引

912 2025-04-04

（转载）ES6、ES7、ES8、ES9、ES10新特性一览

912 2025-04-04

Python 库的安装">Elasticsearch Python 库的安装

912 2025-04-04

ElasticSearch 全文 检索_ElasticSearch 优化

ELK 设置定时清理脚本清理索引

（转载）ES6、ES7、ES8、ES9、ES10新特性一览

Python 库的安装">Elasticsearch Python 库的安装

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理 系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

进销存库存管理盘点">简单进销存库存管理盘点

客户管理工具是什么？">客户管理工具是什么？

友情链接

ElasticSearch 全文检索_ElasticSearch 优化

微信扫一扫：分享

Python 库的安装">Elasticsearch Python 库的安装

推荐文章

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

进销存库存管理盘点">简单进销存库存管理盘点

客户管理工具是什么？">客户管理工具是什么？

友情链接