分布式主动感知在智能运维中的实践|分享实录(物联网中全面感知特点能够感知哪些数据)
675
2022-05-29
在配置DMS for Kafka监控的过程中经常会遇到以下的问题:
从哪些纬度去监控Kafka?
怎么做才能让Kafka持续、有效的提供服务?
Kafka出问题后,如何第一时间收到告警短信/邮件?
......
啊啊啊...这些问题太让人抓狂了......
别担心,本期云小课带您学习配置DMS for Kafka告警通知的方法。
监控指标
DMS for Kafka主要从4个维度监控服务的运行情况,分别为:实例、节点、队列和消费组。
下表介绍DMS for Kafka中必须配置的监控指标,在实际业务中,建议按照以下告警策略,配置监控指标的告警规则。如果想了解所有的监控指标,请戳这里
指标名称
正常范围
告警策略
指标说明和告警处理建议
磁盘容量使用率
0~100
告警阈值:原始值>85
连续触发次数:3
告警级别:紧急
指标说明:该指标为从Kafka节点虚拟机层面采集的磁盘容量使用率。单位:%。
处理建议:出现该告警时,需要修改实例存储空间。具体操作,请参考变更实例规格。
CPU核均负载
0~2
告警阈值:原始值>1.5
连续触发次数:3
告警级别:重要
指标说明:该指标为从Kafka节点虚拟机层面采集的CPU每个核的平均负载。
处理建议:出现该告警时,需要修改实例基准带宽/代理个数,即扩节点。具体操作,请参考变更实例规格。
内存使用率
0~100
告警阈值:原始值>85
连续触发次数:3
告警级别:紧急
指标说明:该指标为Kafka节点虚拟机层面采集的内存使用率。单位:%。
处理建议:出现该告警时,需要修改实例基准带宽/代理个数,即扩节点。具体操作,请参考变更实例规格。
Kafka进程JVM堆内存使用率
0~100
告警阈值:原始值>85
连续触发次数:3
告警级别:紧急
指标说明:该指标从Kafka节点Kafka进程JVM中采集的堆内存使用率。单位:%。
处理建议:出现该告警时,需要修改实例基准带宽/代理个数,即扩节点。具体操作,请参考变更实例规格。
配置告警通知
消费组可消费消息数是判断消息是否堆积的重要指标,下面以配置消费组可消费消息数的告警通知为例,向您介绍配置Kafka监控的方法。
请参考配置消费组可消费消息数告警通知的方法,配置DMS for Kafka其他监控指标的告警通知。
前提条件
在配置消费组可消费消息数告警通知前,确保已购买Kafka实例、创建Topic,并且已成功消费消息。
配置消费组可消费消息数的告警通知
登录DMS for Kafka控制台,在需要创建告警通知的实例所在行,单击,进入云监控服务页面。
在“消费组”页签,设置需要创建告警通知的消费组。
消费组:选择需要创建告警通知的消费组。
队列:选择“全部队列”。
选中“消费组可消费消息数”图表,单击,创建告警规则。
在“创建告警规则”界面,设置告警名称。
名称:您自定义的告警名称,用于识别不同的告警。
描述:告警规则描述,可以不填。
企业项目:告警规则所属的企业项目。只有拥有该企业项目权限的用户才可以查看和管理该告警规则。
在“创建告警规则”界面,设置告警策略。
选择类型:选择“自定义创建”。
告警策略:触发告警规则的告警策略,是否触发告警取决于连续周期的数据是否达到阈值。
告警级别:根据实际情况选择告警等级。
在“创建告警规则”界面,设置告警通知对象。
发送通知:选择开启。
通知对象:选择已创建的主题,主题的订阅信息中包含需要接收告警信息的手机号/邮箱地址。
如果尚未创建主题,参考如下操作创建主题:单击“创建主题”,进入消息通知服务中,创建主题和添加订阅。创建完成后,返回“创建告警规则”页面,在“通知对象”后单击刷新,然后选择创建的主题。
生效时间:该告警规则仅在生效时间内发送通知消息。
触发条件:触发告警通知的条件。
单击“立即创建”,完成告警规则的设置。
告警规则创建完成后,在云监控服务的“告警 > 告警规则”界面,查看新创建的告警规则。
以上,是本次云小课为您带来的全部内容,想了解更多DMS for Kafka相关内容,请戳这里。
Kafka 云小课 分布式消息服务 Kafka
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。