Spark-第9页-伙伴云

Spark 第9页

大家好，我是不温卜火，是一名计算机学院大数据专业大二的学生，昵称来源于成语—不温不火，本意是希望自己性情温和。作为一名互联网行业的小白，博主写博客一方面是为了记录自己的学习过程，另一方面是总结自己所犯的错误希望能够帮助到很多和自己一样处于起步阶段的萌新。但由于水平有限，博客中难免会有一些错误出现，有纰漏之处恳请各位大佬不吝赐教！暂时只有csdn这一个平台，博客主页：https://buwenbuh...

甘特图怎么制作更方便？甘特图制作方法" title="甘特图怎么制作更方便？甘特图制作方法" width="200" height="150">

[置顶]甘特图怎么制作更方便？甘特图制作方法

甘特图 •2025-03-31

本文关于甘特图怎么制作更方便？甘特图制作方法。其实现在制作甘特图的方式有多种多样，可以直接使用表格的方式来制作，或者是使用一些线上工具来制作甘特图都是可以的。今天针对于甘特图制作方式给大家详细的分享一...

数据分析甘特图制作甘特图甘特图工具
OKR的实施标准步骤是什么？成功实施落地OKR的要点" title="OKR的实施标准步骤是什么？成功实施落地OKR的要点" width="200" height="150">

[置顶]OKR的实施标准步骤是什么？成功实施落地OKR的要点

OKR管理 •2025-03-31

本文关于okr的实施标准步骤是什么？成功实施落地OKR的要点。其实有关于Okr工作法，相信很多人都有一定的了解。OKR定义为一个重要的思维框架和一个发展中的学科，旨在确保员工一起工作，并专注于做出可衡...

OKR OKR系统 okr管理
Spark性能优化 (3) | Shuffle 调优

所有内容 •2022-05-28

大家好，我是不温卜火，是一名计算机学院大数据专业大二的学生，昵称来源于成语—不温不火，本意是希望自己性情温和。作为一名互联网行业的小白，博主写博客一方面是为了记录自己的学习过程，另一方面是总结自己所犯...

Spark 性能优化
Spark shuffle介绍：shuffle data生命周期

所有内容 •2022-05-28

shuffle data持久化在磁盘上，如果一直不清理，磁盘容易被撑爆。那shuffle data什么时候会被清理呢。一般来说可以分成3种场景： 1、spark application主动停止，需要清...

Spark shuffle 介绍
2021年大数据Spark（十八）：Spark Core的RDD Checkpoint

所有内容 •2022-05-28

目录 RDD Checkpoint 引入 API 代码演示总结：持久化和Checkpoint的区别问题: 答案: 区别: RDD Checkpoint 引入 RDD 数据可以持久化，但是持久化/缓...

2021年大数据 Spark 十八
spark简介及其架构

所有内容 •2022-05-28

Spark是一个通用的并行计算框架，由加州伯克利大学的AMP于2009开发，并于2010年进行开源，后续发展为大数据领域的最活跃的开源项目之一。Spark在各大场景中扮演着重要的角色，比如能够进行复杂...

Spark 简介及其架构
spark到底是怎么确认内存够不够用的？超大超详细图解！让你掌握Spark memeoryStore内存管理的精髓

所有内容 •2022-05-28

首先回顾一下spark中的BlockManager和memoryStore是做什么的。具体可以看这篇文章： spark的内存管理机制学习——BlockManager 他主要是将没有序列化的java对...

Spark 到底怎么确认
《Spark数据分析：基于Python语言》 —2.2　准备安装Spark

所有内容 •2022-05-28

2.2　准备安装Spark Spark是跨平台的应用程序，可以部署在如下操作系统上： Linux（所有发行版） Windows Mac OS X 尽管没有具体的硬件要求，一般的Spark节点的推荐硬件...

Spark 数据分析
Spark_shuffle调优

所有内容 •2022-05-28

大多数Spark作业的性能主要就是消耗在了shuffle环节，因为该环节包含了大量的磁盘IO、序列化、网络数据传输等操作。因此，如果要让作业的性能更上一层楼，就有必要对shuffle过程进行调优。但是...

Spark shuffle 调优