<a target="_blank" href="https://www.huoban.com/news/tags-337.html"style="font-weight:bold;">Kafka</a> CPU高<a target="_blank" href="https://www.huoban.com/news/tags-1516.html"style="font-weight:bold;">排查</a>思路-伙伴云

Kafka CPU高排查思路

网友投稿 978 2025-04-01

Top命令查看CPU使用率高的进程

su - omm切换到omm用户，jstack -l 进程pid >> 文件路径

top -H -p 进程pid，查看CPU使用率高的线程

"printf "%x\n" 线程号"，将CPU高的线程号转换成16进制

在jstack文件中搜索16进制的线程号查看具体的导致CPU高的线程来进一步分析

集群规划不合理

执行命令grep -c processor /proc/cpuinfo查看CPU核数，执行df -h命令查看Kafka磁盘挂载数，建议每个节点磁盘挂载数<=processor/2，挂载过多磁盘会导致CPU繁忙。

Kafka配置中查看num.io.threads、num.network.threads、num.replica.fetchers配置，num.io.threads和num.network.threads配置值一般建议是磁盘个数的倍数，但不超过CPU核数。num.replica.fetchers配置值一般建议不超过5，同步线程数过多也会造成CPU繁忙。

分区设置不合理：分区数一般设置为节点个数的倍数，单个节点分区数不超过2000。如果分区设置不合理，所有的生产和消费都集中在某个节点上，也可能导致CPU过高。

操作系统句柄数过高

查看操作系统句柄数：cat /var/log/osinfo/statistics/file-nr.txt

统计各进程打开句柄数：lsof -n|awk '{print }'|sort|uniq -c|sort -nr

查看进程使用句柄数：lsof -p 进程pid | wc -l

如果句柄数高，排查使用句柄数高的进程是否有句柄泄漏；排查操作系统日志，查看是否存在TCP内存溢出等。

C++客户端版本不兼容

CPU高的线程在获取元数据信息，kafka-request.log日志中大量获取全部topic的元数据信息

jstack信息中CPU高的线程信息如下图所示：

Request日志开debug后，大量获取全部Topic元数据信息，且耗时很长，如下图所示：

集群中分区数很多，CPU长时间频繁处理获取全部topic及分区元数据信息的请求导致CPU升高。

解决办法是升级C++版本到与服务端对应的版本。

Logstash版本过低与高版本服务端不兼容

Kafka CPU高排查思路

logstash版本过低，请求全部topic的元数据信息，21005端口访问未加权限的topic，请求全部topic的元数据信息导致获取加了权限的topic信息时请求deny，具体表现是kafka-authorizer.log日志中大量请求Deny的日志，如下图所示：

CPU频繁处理大量deny请求导致CPU异常升高

解决办法是升级Logstash到与服务端对应的版本。

sssd异常

使用id -Gn名称返回结果异常，sssd服务有问题，如下图所示：

kafka-authorizer.log日志为大量打印某用户不属于kafka组或者kafkaadmin组，如下图所示：

服务器的kafka无法正常鉴权，导致用户频繁访问此服务器，cpu异常升高。

解决办法是排查sssd异常的原因并恢复sssd。

EI企业智能 FusionInsight

Kafka【入门】看这一篇就够了!">Kafka【入门】看这一篇就够了!

978 2025-04-01

源码 解析之三：Log模块读写源码分析——（一）">kafka源码 解析之三：Log模块读写源码分析——（一）

978 2025-04-01

Kafka 书籍和教程">前 3 名 Kafka 书籍和教程

978 2025-04-01

Kafka CPU高排查思路

Kafka【入门】看这一篇就够了!">Kafka【入门】看这一篇就够了!

源码 解析之三：Log模块读写源码分析——（一）">kafka源码 解析之三：Log模块读写源码分析——（一）

Kafka 书籍和教程">前 3 名 Kafka 书籍和教程

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理 系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

电子表格，居家办公更轻松">用在线电子表格，居家办公更轻松

进销存库存管理盘点">简单进销存库存管理盘点

友情链接

Kafka CPU高排查思路

微信扫一扫：分享

Kafka【入门】看这一篇就够了!">Kafka【入门】看这一篇就够了!

源码解析之三：Log模块读写源码分析——（一）">kafka源码解析之三：Log模块读写源码分析——（一）

Kafka 书籍和教程">前 3 名 Kafka 书籍和教程

推荐文章

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

电子表格，居家办公更轻松">用在线电子表格，居家办公更轻松

进销存库存管理盘点">简单进销存库存管理盘点

友情链接