spark <a target="_blank" href="https://www.huoban.com/news/tags-768.html"style="font-weight:bold;">解决</a>了 hadoop 的哪些问题(spark VS MR)？-伙伴云

spark 解决了 hadoop 的哪些问题(spark VS MR)？

网友投稿 980 2025-04-01

Spark 解决了 Hadoop 的哪些问题(Spark VS MR)？

MR：抽象层次低，需要使用手工代码来完成程序编写，使用上难以上手；

Spark：Spark 采用 RDD 计算模型，简单容易上手。

MR：只提供 map 和 reduce 两个操作，表达能力欠缺；

Spark：Spark 采用更加丰富的算子模型，包括 map、flatmap、groupbykey、reducebykey 等；

MR：一个 job 只能包含 map 和 reduce 两个阶段，复杂的任务需要包含很多个 job，这些 job 之间的管理以来需要开发者自己进行管理；

Spark：Spark 中一个 job 可以包含多个转换操作，在调度时可以生成多个 stage，而且如果多个 map 操作的分区不变，是可以放在同一个 task 里面去执行；

MR：中间结果存放在 hdfs 中；

Spark：Spark 的中间结果一般存在内存中，只有当内存不够了，才会存入本地磁盘，而不是 hdfs；

spark 解决了 hadoop 的哪些问题(spark VS MR)？

MR：只有等到所有的 map task 执行完毕后才能执行 reduce task；

Spark：Spark 中分区相同的转换构成流水线在一个 task 中执行，分区不同的需要进行 shuffle 操作，被划分成不同的 stage 需要等待前面的 stage 执行完才能执行。

MR：只适合 batch 批处理，时延高，对于交互式处理和实时处理支持不够；

Spark：Spark streaming 可以将流拆成时间间隔的 batch 进行处理，实时计算。

spark

excel表格中的折线图突出最高值有什么方法">excel表格中的折线图突出最高值有什么方法

980 2025-04-01

C#编程-48：文本控件复习笔记_彭世瑜_新浪博客

980 2025-04-01

查找两列相关项（查找两列数据的不同项）

980 2025-04-01

spark 解决了 hadoop 的哪些问题(spark VS MR)？

excel表格中的折线图突出最高值有什么方法">excel表格中的折线图突出最高值有什么方法

C#编程-48：文本控件复习笔记_彭世瑜_新浪博客

查找两列相关项（查找两列数据的不同项）

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理 系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

智能定制家居管理系统：重新定义家庭生活方式

定制家居数字化管理模式：提升品质、智能化和个性化的未

友情链接

spark 解决了 hadoop 的哪些问题(spark VS MR)？

微信扫一扫：分享

excel表格中的折线图突出最高值有什么方法">excel表格中的折线图突出最高值有什么方法

推荐文章

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

友情链接