Spark 第3页
-
[置顶]甘特图怎么制作更方便?甘特图制作方法
本文关于甘特图怎么制作更方便?甘特图制作方法。其实现在制作甘特图的方式有多种多样,可以直接使用表格的方式来制作,或者是使用一些线上工具来制作甘特图都是可以的。今天针对于甘特图制作方式给大家详细的分享一...
-
[置顶]okr的实施标准步骤是什么?成功实施落地OKR的要点
本文关于okr的实施标准步骤是什么?成功实施落地OKR的要点。其实有关于Okr工作法,相信很多人都有一定的了解。OKR定义为一个重要的思维框架和一个发展中的学科,旨在确保员工一起工作,并专注于做出可衡...
-
Spark 编程模型(上)
从Hadoop MR到Spark 回顾hadoop—mapreduce计算过程 MR VS Spark Spark编程模型 核心概念 注意:对比mr里的概念来学习 Spark Application的...
-
【SparkAPI JAVA版】JavaPairRDD——cartesian(三)
Return the Cartesian product of this RDD and another one, that is, the RDD of all pairs of elements...
-
讲一下spark的几种部署方式
讲一下spark的几种部署方式 目前,除了local模式为本地调试模式以为, Spark支持三种分布式部署方式,分别是standalone、spark on mesos和 spark on YARN...
-
Spark运行模式概述
Spark编程模型回顾 Spark编程模型几大要素 ● Driver Program ● 输入-Transformation-Action ● 缓存 ● 共享变量 RDD的五大特征 ● 分区---...
-
《Spark数据分析:基于Python语言 》 —1.2.7 Spark与Hadoop
1.2.7 Spark与Hadoop 如前所述,Hadoop和Spark两者是紧密关联的,它们有共同的历史,核心的并行处理概念也有共通之处,比如无共享和数据本地化。下面我们了解一下Hadoop和Spa...
-
基于Spark的机器学习实践 (八) - 分类算法
0 相关源码 1 朴素贝叶斯算法及原理概述 1.1 朴素贝叶斯简介 ◆ 朴素贝叶斯算法是基于贝叶斯定理和特征条件独立假设的一种分类方法 ◆ 朴素贝叶斯算法是一种基于联合概率分布的统计学习方法 ◆ 朴素...
-
【SparkAPI】JavaPairRDD——countByKey、countByKeyApprox
/** * Count the number of elements for each key, collecting the results to a local Map. * * @note Th...
-
【SparkAPI】countApprox、countApproxDistinct、countApproxDistinctByK
/** * Approximate version of count() that returns a potentially incomplete result * within a timeout...
-
Apache Spark 远程代码执行漏洞(CVE-2020-9480)
一、概要 近日华为云监测到Apache Spark官方发布安全公告,披露在Apache Spark ˂= 2.4.5的版本中存在一处远程代码执行漏洞(CVE-2020-9480)。由于Spark的认证...