<a target="_blank" href="https://www.huoban.com/news/tags-463.html"style="font-weight:bold;">快速</a><a target="_blank" href="https://www.huoban.com/news/tags-715.html"style="font-weight:bold;">理解</a>spark-on-k8s中的external-shuffle-service-伙伴云

快速理解spark-on-k8s中的external-shuffle-service

网友投稿 1056 2025-04-01

快速理解spark-on-k8s中的external-shuffle-service

如果你想在kubernetes集群中运行Spark任务，那么你可能会对：如何在k8s上运行external-shuffle-service感兴趣。把Driver和Executor都当做容器，丢到k8s上（k8s集群则把他们当做一般的容器，和其他业务类app一样对待），这种模式，可以使得集群资源池归一，避免Spark一个资源池，业务类（K8S）集群一个资源池。提升整体资源利用率，统一维护也降低运维成本。这也是Spark官方在2.3版本后为什么要支持Spark-on-k8s的主要驱动力。

1 external-shuffle-service作用

如果想要executor数量可以动态变化，就需要依赖external-shuffle-service功能（注意这句话，因为在k8s集群中，容器启动关闭很方便。所以非常希望executor数量可以动态调整，提升资源利用率）。

原因是在shuffle过程中，一个executor会到另一个executor那里取数据。如果一个executor节点挂掉了，那么它也就无法处理其他executor发过来的 shuffle 的数据读取请求了，它之前生成的数据都没有意义了。为了解决“取shuffle数据”，和“目标executor是否运行”分开。Spark引入了external-shuffle-service服务。相当于先把shuffle数据暂存到external-shuffle-service那里，然后大家去external-shuffle-service那里取就行了（有点像个中介）。

好文参考：https://zhmin.github.io/2019/08/05/spark-external-shuffle-service/

2 原来怎么部署

在原Spark框架中，external-shuffle-service是部署在每个节点上的。

（图还是来自上面的那个链接）

（1）executor 告诉 external-shuffle-service 数据存放在哪里，然后（2） external-shuffle-service 记下来，供别人查询。所以问题的关键是，数据放“哪里”支持哪些格式呢。我们看（1）里面通知是结构是长这样：

public class RegisterExecutor extends BlockTransferMessage {

public final String appId; // spark application id

public final String execId; // executor id

public final ExecutorShuffleInfo executorInfo; // 《==文件路径

}

可以看出来，关键在 “在哪里” 要看（2）长什么样：

public class ExecutorShuffleInfo implements Encodable {

public final String[] localDirs; // 《== 第一级目录列表

public final int subDirsPerLocalDir; // 第二级目录列表

public final String shuffleManager; // shuffleManager的类型，目前只有一种类型 SortShuffleManager

}

可以看到，这个shuffle数据 “在哪里” 只能支持HostPath（本地路径）。

问题的关键就来了：executor容器跑在k8s节点上面，external-shuffle-service跑在另一个容器里面。要想共享相同Path文件，那就必须使用节点路径（k8s-hostpath）。要用这个Hostpath 还得拥有节点的所有权，这个对于多用户共享的K8s集群来说，权限不安全，数据未隔离。

3 在k8s上要怎么解决（一）

Spark的external-shuffle-service要怎么在k8s上运行，这是个问题。Spark社区关于这个有个讨论：https://docs.google.com/document/d/1uCkzGGVG17oGC6BJ75TpzLAZNorvrAU3FRd2X-rVHSM/edit#heading=h.btqugnmt2h40

这个文档主要是说：

当前external-shuffle-service的实现有缺点：（1）多个Spark应用共用一个external-shuffle-service，如果external-shuffle-service出问题，多个Spark应用都受影响，即隔离性差。（2）一个节点一个external-shuffle-service，导致不同节点间压力不均衡。同时如果节点挂了，external-shuffle-service也就没了，这个节点上面的所有executor都受影响，可靠性差。（3）在当前较火热的Docker容器环境下，executor写入的shuffle数据（在一个容器内）。不一定就能被external-shuffle-service读取到（在另一个容器内）。因为有些k8s集群中，管理员出于安全考虑，会强制隔离不同用户的容器，禁止任何共享。

所以提出了改进方向：即executor保存shuffle数据时，不限定非得是保存在本地Path中。

具体实现方案可以有多种。

（1）保存shuffle数据时，通过external-shuffle-service上传的方式。

（2） external-shuffle-service支持shuffle数据为远端uri地址，而不仅仅是主机路径。

（3）由Driver来维护所有的shuffle数据信息，取消external-shuffle-service组件。

（4）将shuffle数据保存到分布式存储中。

（5）将shuffle数据上传到external-shuffle-service，然后由Driver跟踪文件路径。

总体思路就是：以前external-shuffle-service是本地写，远程读。调整为：远程写，远程读。

4 在k8s上要怎么解决（二）

其实要在k8s上实现executor数量动态调整（dynamic resource allocation），还有另一条小路（即不通过external-shuffle-service的方式）。并且这条路已经实现了，在这个PR里面。https://github.com/apache/spark/pull/24817

Ø 实现原理：

当发现executor里面是shuffle数据没有用了，则可以删除该executor。如果这个executor里面的shuffle数据，还会被其他Jop读取，那么就保持这个executor存活着不被删除。从而实现executor数量可以动态调整。

Ø 缺点：

可以看出来，这种方式其实是一种缓兵之计。（1）删除部分暂时不被使用executor，但是必须保留那些还会被使用的executor。所以动态效果并不是最优的。另外，（2）一个executor也许最近不被使用，被删除了。但是后续其他Stage又有可能去访问那个shuffle数据。结果发现找不到（被动态删除嘛），这个时候又得重新计算，浪费性能。

PR里面的讨论也说了，这个是无法用来完整替代external-shuffle-service的。

5 路标计划

通过上面的分析，基本了解了在k8s上面跑external-shuffle-service的困难和思路。

所以要达到目的的路径为：（1）external-shuffle-service支持远端保存shuffle数据。（2）executor和external-shuffle-service共享云端shuffle数据。（3）executor数量可以动态调整，不影响功能。（4）在k8s上支持了executor数量动态调整（dynamic resource allocation）。

看Spark的规划是在 3.0.0 版本提供完整能力，嗯，让我们期待Spark on K8s越来越溜吧。

https://issues.apache.org/jira/browse/SPARK-24432

Spark

快速跳到我想要的那一页（怎么快速到下一页）">怎么快速跳到我想要的那一页（怎么快速到下一页）

1056 2025-04-01

怎么在表格里快速查找名字（怎么在表格中查找名字）">怎么在表格里快速查找名字（怎么在表格中查找名字）

1056 2025-04-01

快速将 Excel 一列数据分成若干列以便打印节约纸张（如何快速将word转化为ppt）">如何快速将 Excel 一列数据分成若干列以便打印节约纸张（如何快速将word转化为ppt）

1056 2025-04-01

快速 理解spark-on-k8s中的external-shuffle-service

快速跳到我想要的那一页（怎么快速到下一页）">怎么快速跳到我想要的那一页（怎么快速到下一页）

怎么在表格里快速查找名字（怎么在表格中查找名字）">怎么在表格里快速查找名字（怎么在表格中查找名字）

快速将 Excel 一列数据分成若干列以便打印节约纸张（如何快速将word转化为ppt）">如何快速将 Excel 一列数据分成若干列以便打印节约纸张（如何快速将word转化为ppt）

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理 系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

什么是在线文档？怎么发在线文档

进销存库存管理盘点">简单进销存库存管理盘点

友情链接

快速理解spark-on-k8s中的external-shuffle-service

微信扫一扫：分享

快速跳到我想要的那一页（怎么快速到下一页）">怎么快速跳到我想要的那一页（怎么快速到下一页）

怎么在表格里快速查找名字（怎么在表格中查找名字）">怎么在表格里快速查找名字（怎么在表格中查找名字）

快速将 Excel 一列数据分成若干列以便打印节约纸张（如何快速将word转化为ppt）">如何快速将 Excel 一列数据分成若干列以便打印节约纸张（如何快速将word转化为ppt）

推荐文章

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

进销存库存管理盘点">简单进销存库存管理盘点

友情链接