Fusion Insight 集群 功能介绍-Flume

网友投稿 759 2022-05-28

基本原理

简介

Flume是一个分布式、可靠和高可用的海量日志聚合系统，支持在系统中定制各类数据发送方，用于收集数据；同时，Flume提供对数据进行简单处理，并写入各种数据接受方（可定制）的能力。Flume有如下几个特点：

● 收集、聚合事件流数据的分布式框架

● 通常用于log数据

● 采用ad-hoc方案（多跳，无中心控制节点方案）

● 声明式配置，可以动态更新配置

● 提供上下文路由功能

● 支持负载均衡和故障转移

● 完全的可扩展

结构

Flume Agent由Source、Channel、Sink组成，如图1-31所示，模块说明如表1-4所示。

图 1-31 Flume 结构图 1

表 1-4 模块说明

FusionInsight 集群功能介绍-Flume

Flume也可以配置成多个Source、Channel、Sink，如图1-32所示：

图 1-32 Flume 结构图 2

Flume还支持多个Flume Agent级联，如图1-33所示。

图 1-33 Flume 级联结构图

原理

Agent之间的可靠性

Agent之间数据交换流程如图1-34所示

图 1-34 Agent 数据传输流程

Flume采用基于Transactions的方式保证数据传输的可靠性，当数据从一个Agent 流向另外一个Agent时，两个Transactions已经开始生效。发送Agent的Sink首先从Channel取出一条消息，并且将该消息发送给另外一个Agent。如果接受消息的 Agent成功地接受并处理消息，那么发送Agent将会提交Transactions，标识一次数据传输成功可靠地完成。

当接收Agent接受到发送Agent发送的消息时，开始一个新的Transactions，当该数据被成功处理（写入Channel中），那么接收Agent提交该Transactions，并向发送Agent发送成功响应。

如果在某次提交（commit）之前，数据传输出现了失败，将会再次开始上一次 Transactions，并将上次发送失败的数据重新传输。因为commit操作已经将 Transactions写入了磁盘，那么在进程故障退出并恢复业务之后，仍然可以继续上次的Transactions。

与组件的关系

与 HDFS 的关系

当用户配置HDFS作为Flume的Sink时，HDFS就作为Flume的终数据存储系统， Flume将传输的数据全部按照配置写入HDFS中。

与 HBase 的关系

当用户配置HBase作为Flume的Sink时，HBase就作为Flume的终数据存储系统， Flume将传输的数据全部按照配置写入HBase中。

增强特性

提升传输速度

可以配置将指定的行数作为一个Event，而不仅是一行，提高了代码的执行效率以及减少写入磁盘的次数。

传输超大二进制文件

Flume根据当前内存情况，自动调整传输超大二进制文件的内存占用情况，不会导致 Outofmemory出现。

支持定制传输前后准备工作

Flume支持定制脚本，指定在传输前或者传输后执行指定的脚本，用于执行准备工作。

管理客户端告警

Flume通过MonitorServer接收Flume客户端告警，并上报Manager告警管理中心。

Hadoop FusionInsight

标签：Fusion Insight 集群功能

Fusion Insight 集群 功能介绍-Flume

excel能翻译英语吗

excel表格如何筛选特定内容

excel表格如何换行攻略来了

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜

智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

什么是在线文档？怎么发在线文档

用在线电子表格，居家办公更轻松

友情链接