HBase的3个重要机制-伙伴云

HBase的3个重要机制

网友投稿 887 2022-05-28

本篇博客，小菌为大家带来的是关于HBase的3个重要机制。

1.flush 机制

1.(

hbase.regionserver.global.memstore.size

) 默认;堆大小的40%

regionServer的全局memstore的大小，超过该大小会触发flush到磁盘的操作,默认是堆大小的40%,而且regionserver级别的flush会阻塞客户端读写

2.(

hbase.hregion.memstore.flush.size

) 默认：128M

HBase的3个重要机制

单个region里memstore的缓存大小，超过那么整个HRegion就会flush。

3.(

hbase.regionserver.optionalcacheflushinterval

) 默认：1h

内存中的文件在自动刷新之前能够存活的最长时间

hbase.regionserver.global.memstore.size.lower.limit

默认：堆大小 * 0.4 * 0.95

有时候集群的“写负载”非常高，写入量一直超过flush的量，这时，我们就希望memstore不要超过一定的安全设置。在这种情况下，写操作就要被阻塞一直到memstore恢复到一个“可管理”的大小, 这个大小就是默认值是堆大小 * 0.4 * 0.95，也就是当regionserver级别的flush操作发送后,会阻塞客户端写,一直阻塞到整个regionserver级别的memstore的大小为堆大小 * 0.4 *0.95为止

5.(

hbase.hregion.preclose.flush.size

) 默认为：5M

当一个 region 中的 memstore 的大小大于这个值的时候，我们又触发了 close.会先运行“pre-flush”操作，清理这个需要关闭的memstore，然后将这个 region 下线。当一个 region 下线了，我们无法再进行任何写操作。如果一个 memstore 很大的时候，flush 操作会消耗很多时间。“pre-flush” 操作意味着在 region 下线之前，会先把 memstore 清空。这样在最终执行 close 操作的时候，flush 操作会很快。

6.(

hbase.hstore.compactionThreshold

) 默认：超过3个

一个store里面允许存的hfile的个数，超过这个个数会被写到新的一个hfile里面也即是每个region的每个列族对应的memstore在fulsh为hfile的时候，默认情况下当超过3个hfile的时候就会对这些文件进行合并重写为一个新文件，设置个数越大可以减少触发合并的时间，但是每次合并的时间就会越长。

2、compact机制

详细请见《HBase官方文档》

主要就是当小的storeFile文件达到三个，会合并成大的Storefile文件。并且清理过期的数据，包括删除的数据,将数据的版本号保存为3个。

3.split机制

当Region达到阈值，会把过大的Region一分为二。

默认一个HFile达到10Gb的时候就会进行切分。

总结

Flush 机制

hbase.regionserver.global.memstore.size：默认;堆大小的40%

regionServer的全局memstore的大小（多个CF的memstore-多个region），超过该大小会触发flush到磁盘的操作，会阻塞客户端读写flush将所有的memstore全部flush.hbase不建议配置过多列族：过多的列族会消耗大量的内存，同时数据在flush时消耗磁盘IO.一个regionserver续写操作可用堆内存的80%，读取占用40% ，写入占用40%。这两个参数直接影响hbase读写性能。

hbase.hregion.memstore.flush.size：默认：128M（单个region里memstore的缓存大小）

hbase.regionserver.optionalcacheflushinterval：默认：1h

hbase.regionserver.global.memstore.size.lower.limit：默认：堆大小 0.95倍

hbase.hregion.preclose.flush.size：默认为：5M 提前进行flush.(先flush一小部分，等后面数据达到阈值在flush后

面的数据) 好处：比一次flush效率高

什么时候触发合并

hbase.hstore.compactionThreshold：默认：3个（flush文件的数量超过3个进行合并）

compact机制

默认3个

小的storeFile 文件达到3个,合并成大的storeFile文件。

split机制

默认一个HFile达到10Gb的时候就会进行切分

好了本次的分享就到这里了,对大数据技术感兴趣的朋友记得关注小菌哟(＾Ｕ＾)ノ~ＹＯ

HBase

Excel1分钟3个简单技巧学会了就不用加班了批量填充序列对话框（excel公式）

887 2022-05-28

HBase的3个 重要 机制

重要资料搜索引擎的用法

Excel1分钟3个简单技巧学会了就不用加班了批量填充序列对话框（excel公式）

wps3个快速调整表格技巧 wps表格入门基础教程（wps如何快速调整表格）

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜

智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

什么是在线文档？怎么发在线文档

简单进销存库存管理盘点

友情链接