Spark 第5页
-
甘特图怎么制作更方便?甘特图制作方法" title="甘特图怎么制作更方便?甘特图制作方法" width="200" height="150">
-
OKR的实施标准步骤是什么?成功实施落地OKR的要点" title="OKR的实施标准步骤是什么?成功实施落地OKR的要点" width="200" height="150">
-
《Spark数据分析:基于Python语言 》 —2.5 在Windows上安装Spark
2.5 在Windows上安装Spark 在Windows上安装Spark比在Linux或Mac OS X上更麻烦一些,因为要先解决Python和Java等依赖的安装。本例使用Windows Serv...
-
Spark环境搭建——on yarn集群模式
本篇博客,Alice为大家带来关于如何搭建Spark的on yarn集群模式的教程。 文章目录 准备工作 cluster模式 client模式[了解] 两种模式的区别 官方文档: http://spa...
-
Spark 编程模型(上)
从Hadoop MR到Spark 回顾hadoop—mapreduce计算过程 MR VS Spark Spark编程模型 核心概念 注意:对比mr里的概念来学习 Spark Application的...
-
Spark运行模式概述
Spark编程模型回顾 Spark编程模型几大要素 ● Driver Program ● 输入-Transformation-Action ● 缓存 ● 共享变量 RDD的五大特征 ● 分区---...
-
《Spark数据分析:基于Python语言 》 —1.2.7 Spark与Hadoop
1.2.7 Spark与Hadoop 如前所述,Hadoop和Spark两者是紧密关联的,它们有共同的历史,核心的并行处理概念也有共通之处,比如无共享和数据本地化。下面我们了解一下Hadoop和Spa...
-
基于Spark的机器学习实践 (八) - 分类算法
0 相关源码 1 朴素贝叶斯算法及原理概述 1.1 朴素贝叶斯简介 ◆ 朴素贝叶斯算法是基于贝叶斯定理和特征条件独立假设的一种分类方法 ◆ 朴素贝叶斯算法是一种基于联合概率分布的统计学习方法 ◆ 朴素...
-
Apache Spark 远程代码执行漏洞(CVE-2020-9480)
一、概要 近日华为云监测到Apache Spark官方发布安全公告,披露在Apache Spark ˂= 2.4.5的版本中存在一处远程代码执行漏洞(CVE-2020-9480)。由于Spark的认证...
-
Spark Core快速入门系列(12) | 变量与累加器问题
大家好,我是不温卜火,是一名计算机学院大数据专业大二的学生,昵称来源于成语—不温不火,本意是希望自己性情温和。作为一名互联网行业的小白,博主写博客一方面是为了记录自己的学习过程,另一方面是总结自己所犯...
-
基于Spark的机器学习实践 (九) - 聚类算法
0 相关源码 1 k-平均算法(k-means clustering)概述 1.1 回顾无监督学习 ◆ 分类、回归都属于监督学习 ◆ 无监督学习是不需要用户去指定标签的 ◆ 而我们看到的分类、回归算法...
-
《Spark数据分析:基于Python语言 》 —1.1.2 Hadoop简介
1.1.2 Hadoop简介 Hadoop是一个数据存储与数据处理平台,项目起源于数据本地化的核心概念。数据本地化(data locality)指在数据存储的地方处理数据,让计算靠近数据,而不是像数据...