架构 第9页

Spark是一个通用的并行计算框架,由加州伯克利大学的AMP于2009开发,并于2010年进行开源,后续发展为大数据领域的最活跃的开源项目之一。Spark在各大场景中扮演着重要的角色,比如能够进行复杂的批数据处理,基于实时数据流的数据处理和历史数据的交互式查询。在实时大数据应用的场景下,相比于Hadoop的高吞吐,低响应的特点,spark通过内存计算能力极大提高了大数据处理速度,对实时场景能够提供...

特别声明: 版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。