关于GaussDB(DWS)多租户管理,这些你一定要知道

网友投稿 911 2022-05-29

一、多租户的背景及意义

多租户为满足客户混合负载处理需求而生,通过提供两层用户机制,分层资源隔离,满足客户对计算和存储资源的自主控制需求。两级用户分别关联不同的资源池和存储空间,实现多租户下资源分组管理。

二、GaussDB(DWS)的多租户

目前GaussDB(DWS)的多租户能够进行隔离的资源包括:CPU资源、内存资源、IO资源、存储资源。

GaussDB的多租户通过绑定资源池来实现,具体原理如下图所示:

借助上图说明多租户的管控方式,见往下三、四、五章节。

三、控制组设置

通过设置控制组可以进行以下几方面的资源隔离:

(1)设置CPU核数和控制组CPU份额,进行CPU资源管理;

(2)设置异常规则来对异常作业进行终止或降级;

1、class控制组

创建名称为“class_a”的子Class控制组,CPU资源配额分别为Class的40%。

gs_cgroup -c -S class_a -s 40

2、workload控制组

创建子Class控制组“class_a”下名称为“workload_a1”的Workload控制组,CPU资源配额分别为“class_a”控制组的20%。

gs_cgroup -c -S class_a -G workload_a1 -g 20

3、异常规则

设置“class_a”下属“workload_a1”的作业阻塞到1200秒或执行2400秒时执行终止动作。

gs_cgroup -S class_a -G workload_a1 -E "blocktime=1200,elapsedtime=2400" -a

支持的控制组异常规则:

关于GaussDB(DWS)多租户管理,这些你一定要知道

异常阈值类型

说明

取值范围(0表示取消设置)

支持的异常操作

blocktime

作业的阻塞时间,单位秒。包括全局并发排队以及局部并发排队的总时间。

0~UINT_MAX

abort

elapsedtime

作业的已被执行时间,单位秒。从开始执行到当前所消耗的时间。

0~UINT_MAX

abort

allcputime

作业在所有DN上执行时所耗费的CPU总时间,单位秒。

0~UINT_MAX

abort,penalty

cpuskewpercent

作业在DN上执行时的CPU时间的倾斜率,依赖于qualificationtime的设置。

0~100

abort,penalty

qualificationtime

检查作业执行cpu倾斜率的间隔时间,单位秒,需同cpuskewpercent一起设置。

0~UINT_MAX

none

spillsize

作业在DN上下盘的数据量,单位MB。

0~UINT_MAX

abort

broadcastsize

作业在DN上算子大表广播数据量,单位MB。

0~UINT_MAX

abort

四、资源池设置

通过设置资源池属性可以进行以下几方面的资源隔离:

(1)通过设置mem_percent、memory_limit进行内存资源管理;

(2)通过设置io_limits、io_priority进行IO管控;

(3)通过设置active_statements、max_dop进行并发管控;

(4)可以设置指定的控制组,进行CPU和异常规则的管理;

(5)设置资源池异常规则;

1、组资源池

创建名称为“resource_pool_a”的组资源池关联到了“class_a”控制组。

CREATE RESOURCE POOL resource_pool_a WITH (control_group='class_a');

2、业务资源池

(1)创建名称为“resource_pool_a1”的业务资源池关联到了“workload_a1”控制组

CREATE RESOURCE POOL resource_pool_a1 WITH (control_group='class_a:workload_a1');

(2)更新一个资源池,其控制组指定为"DefaultClass"组下属的"High" Timeshare Workload控制组。

ALTER RESOURCE POOL pool1 WITH (CONTROL_GROUP="High");

(3)修改资源池“resource_pool_a1”的内存比例为可用内存大小的20%,即设置MEM_PERCEN的取值为20。

ALTER RESOURCE POOL resource_pool_a1 WITH (MEM_PERCENT=20);

3、可设置的资源池属性

属性

属性值

说明

mem_percent

0

最大占用内存百分比。0代表不限制。

control_group

DefaultClass:Medium

资源池关联的控制组。

active_statements

-1

资源池允许的最大并发数。-1和0代表不限制。

max_dop

-1

资源池允许的简单作业最大并发数。-1和0代表不限制

memory_limit

default

使用该资源池的作业估算内存上限。default表示最大为资源池内存一半,unlimited表示不限制。

io_limits

0

每秒触发IO的次数上限。行存单位是万次/s,列存是次/s。0表示不控制。

io_priority

None

IO利用率高达90%时,重消耗IO作业进行IO资源管控时关联的优先级等级。None表示不控制。

4、可设置的资源池异常规则

异常阈值类型

说明

取值范围(0表示取消设置)

支持的异常操作

mem_limit

作业在单实例上使用内存上限。

32MB~max_dynamic_memory

abort

五、用户设置

通过设置用户属性进行存储空间管控:

1、创建组用户关联组资源池

CREATE USER tenant_a RESOURCE POOL 'resource_pool_a' PASSWORD 'Gauss_234';

2、创建业务用户关联业务资源池

CREATE USER tenant_a1 RESOURCE POOL 'resource_pool_a1' USER GROUP 'tenant_a' PASSWORD 'Gauss_234';

3、通过设置用户属性(PERM SPACE、TEMP SPACE、SPILL SPACE)可以进行存储空间管控:

(1)修改用户“tenant_space_test”永久表空间限额不受限制。

ALTER USER tenant_space_test PERM SPACE 'unlimited';

(2)修改用户“tenant_space_test”临时表空间限额为100G。

ALTER USER tenant_space_test TEMP SPACE '100G';

(3)修改用户“tenant_space_test”算子落盘空间限额为200G。

ALTER USER tenant_space_test SPILL SPACE '200G';

六、总结

上文主要介绍了多租户技术的架构和使用方法,通过租户关联控制组和资源池,多租户的设置有效隔离了CPU资源、内存资源、IO资源和存储资源,提供了有力的混合负载管理能力。

想了解GuassDB(DWS)更多信息,欢迎微信搜索“GaussDB DWS”关注微信公众号,和您分享最新最全的PB级数仓黑科技~

EI企业智能 Gauss AP 数据仓库服务 GaussDB(DWS)

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:《零基础看得懂的C++入门教程 》——(7)小数组玩起来
下一篇:【Tech实验室】第2期——《奔跑吧,Java》征文集锦:零基础学Java,一文带你看懂复刻版王者荣耀活动代码
相关文章