《企业级大数据平台构建：架构与实现》—

《企业级大数据平台构建：架构与实现》——2.5.2　数据模型

网友投稿 713 2022-05-28

2.5.2　数据模型

RDD是弹性分布式数据集（Resilient Distributed Datasets）的缩写，它是Map-Reduce模型的扩展和延伸。Spark之所以能够同时支撑大数据的多个领域，在很大程度上是依靠了RDD的能力。虽然批处理、流计算、图计算和机器学习这些计算场景之间初看起来风马牛不相及，但是它们都存在一个共同的需求，那就是在并行计算阶段能够高效的共享数据。RDD的设计者们洞穿了这一现象，于是通过高效的数据共享概念和类似MapReduce的操作设计了RDD，使得它能模拟迭代式算法、关系查询、MapReduce和流式处理等多种编程模型。同时它也是一个可容错的、可并行的数据结构，可以让用户指定将数据存储到磁盘和内存中，并能控制数据的分区。同时它还提供了一些高效的编程接口操作数据集。

《企业级大数据平台构建：架构与实现》——2.5.2　数据模型

大数据 MapReduce

销售报表分析的秘密，掌握数据让业绩飞跃

713 2022-05-28

《企业级大数据 平台构建：架构与实现》——2.5.2　数据模型

选择适合你的库存盘点软件指南

电商ERP解决方案助力企业实现业务飞跃

销售报表分析的秘密，掌握数据让业绩飞跃

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜

智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

客户管理工具是什么？

简单进销存库存管理盘点

友情链接

《企业级大数据平台构建：架构与实现》——2.5.2 数据模型

微信扫一扫：分享

推荐文章

最近发表

热评文章

友情链接

《企业级大数据平台构建：架构与实现》——2.5.2　数据模型