大数据——Hadoop 2.x 生态系统及技术架构图-伙伴云

大数据——Hadoop 2.x 生态系统及技术架构图

网友投稿 711 2022-05-28

一、负责收集数据的工具：

Sqoop（关系型数据导入Hadoop）

Flume（日志数据导入Hadoop，支持数据源广泛）

Kafka（支持数据源有限，但吞吐大）

二、负责存储数据的工具：

HBase

MongoDB

Cassandra

Accumulo

MySql

Oracle

DB2

HDFS（Hadoop Distribut File System）2.0

三、底层组件

Apache Common（通用模块）、

Avro（序列化成二进制）、

OS（Linux、windows。。。）

四、通用工具

Zookeeper分布式协作服务

Oozie工作流流调度系统

Ambari图形化部署、非xml，跟踪集群状态

五、分布式计算框架

MapReduce（通过磁盘离线计算）

Spark（通过内存实时计算）

Storm（实现流式数据计算）

Tez（GAG计算，对MR拆分）

Impala（实现实时交互式计算）

Flink、Slider、Open MPI

HCatalog

YARN（跨集群资源调度管理）以上各种计算框架架构在YAEN上，H2.0引入

六、数据分析处理

Hive数据仓库

sql语句生成MR作业

Pig工作流引擎

类似sql比MR语法简单

Mahout数据挖掘库

提供了诸多机器学习算法

Java、.net

大数据——Hadoop 2.x 生态系统及技术架构图

R、Scala、Solr

Impapla、Ohter ISV

七、结果输出

经过数据分析处理，输出到BI工具、展示系统

ETL Tools

BI Reporting

RDBMS

OLAP

Hadoop 大数据

云数据管理如何助力企业实现数据驱动的决策

711 2022-05-28

大数据——Hadoop 2.x 生态系统及技术架构图

探索BI系统搭建的必要性与AI技术的应用潜力

云数据管理如何助力企业实现数据驱动的决策

BI系统实施步骤全面解析——从需求分析到用户培训

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜

智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

用在线电子表格，居家办公更轻松

Excel项目进度表模板，简化您的项目进度管理

友情链接