怎样添加多个轴线(如何在轴网中添加轴线)
3971
2022-08-13
本文关于数据分析人士必知:图表类型有哪些,分析不同数据怎么用?
数据分析图表类型浩如烟海,常常让人眼花缭乱,无所适从。真可谓「乱花渐欲迷人眼,不知从哪开始选」!
今天,小编就来带你涨姿势——全方位无死角的认识各种数据图表。
这样,当你选择恐惧症犯了的时候,就知道该如何选择啦~
一、形形色色的数据分析图,总有一款适合你
数据分析图表大体可以分成趋势、占比、对比、结构、聚类、离群、关联、分布这几类,为了方便理解,小编亲自手绘了这张简易版框架图,可供您参考。
ps:虽然看起来这么多,但其实工作中常用的不超过10种,可以重点看下标红的部分哟。
注:文末,小编还准备了2000+数据可视化模板大礼包,千万看到最后去领哟~
第一类: 趋势型
折线图、面积图等能很好地体现数据趋势,常用于显示随时间变化的数值。
折线图、面积图有便于展示多个类别(项目)数据的趋势变化,不显得过于拥挤。
1.折线图
统计图表,常用来表示数值随连续时间间隔或有序类别的变化。
从数据上来说,折线图需要一个连续时间字段或一个分类字段和至少一个连续数据字段。
2.面积图
或称区域图,是一种随有序变量的变化,反映数值变化的统计图表,原理与折线图相似。也可用于多个系列数据的比较。
面积图可以表达数据的总量和趋势。不仅可以清晰地反映出数据的趋势变化,也能够强调不同类别的数据间的差距对比。
3.桑基图 (Sankey Diagram)
有时也被称为“冲积图”。是一种表现流程的示意图,用于描述一组值到另一组值的流向。
分支的宽度对应了数据流量的大小。这种图包含流入、流出的节点,以及曲线型的边,往往呈现出彩带一般的效果。
使用桑基图时,应注意变量的归类和颜色的选择,避免太过花哨、影响阅读。必要时建议加入交互功能。
第二类:对比型
1.柱状图
柱状图&条形图
条形图和柱状图表达的数据的形式基本相同,都是矩形条对不同类别进行数值比较的统计图表,数值则决定了柱子的高/长度。
不过,二者也有区别:
条形图由于是横向的,所以更适合用于一些类别名称比较长的数据,这样就可以显示完整;而柱状图会因为太长变成45度显示,或是省略部分内容,影响美观。
条形图可以做成横向的旋风图,进行对比,很漂亮,也比较直观;柱状图不行。
柱状图可以与折线图配合次坐标轴,做成复合型图表,如双轴图;条形图在这点上想实现比较费力。
1.1分组柱状图
分组柱状图,又叫聚合柱状图。当使用者需要在同一个轴上显示各个分类下不同的分组时,需要用到分组柱状图。
跟柱状图类似,使用柱子的高度来映射和对比数据值。每个分组中的柱子使用不同的颜色或者相同颜色不同透明的方式区别各个分类,各个分组之间需要保持间隔。
分组柱状图经常用于不同组间数据的比较,这些组都包含了相同分类的数据。
1.2堆叠柱状图
常被用于比较不同类别的数值。而且,它的每一类数值内部,又被划分为多个子类别,这些子类别一般用不同的颜色来指代。
如果说柱状图可以帮助我们观察“总量”,那么堆叠柱状图则可以同时反映“总量”与“结构”。即,总量是多少?它又是由哪些部分构成的?
进而,我们还可以探究哪一部分比例最大,以及每一部分的变动情况等等。
1.3百分比堆叠柱状图
每根柱子是等长的,总额为100%。
柱子内部被分割为多个部分,高度由该部分占总体的百分比决定。因此,与普通的柱状图或堆叠柱状图不同,100%堆叠柱状图不显示数据的“绝对数值”,而是显示“相对比例”。
但同时,它也仍然具有柱状图的固有功能,即“比较”,我们可以通过比较多个柱子的构成,分析数值之间的相对差异,或者得出数值变化的趋势。
2.雷达图
雷达图是一种显示多变量数据的图形方法。显示类别(项目)有三个或更多维度的变量对比情况,以及不同类别(项目)多个维度的变量差异。
雷达图可以用来在变量间进行对比,或者查看变量中有没有异常值。
另外,多幅雷达图之间或者雷达图的多层数据线之间,还可以进行总体数值情况的对比。
3.南丁格尔玫瑰图
又名鸡冠花图、极坐标区域图。
尽管外形很像饼图,但本质上来说,南丁格尔玫瑰图更像在极坐标下绘制的柱状图。
只不过,它用半径来反映数值(而饼图是以扇形的弧度来表示数据的)。
但是,由于半径和面积之间是平方的关系,视觉上,南丁格尔玫瑰图会将数据的比例夸大。
4.词云图
用于显示文本数据,当大量文本数据显示时,使用类似云彩的图形来显示各种词汇,并根据显示数据的大小频率等设置最突出文字。
能通过形成“关键词云层”或“关键词渲染”,让人从大量的词语中让人一眼看到关键词。
5.哑铃图
指用一条横线连接两个点、看起来有点像哑铃的图,适用于强调从一个点到另一个点的变化。
第三类:占比型
可利用饼图、环形图、南丁格尔玫瑰图等,来展现及对比各类数值占比情况。
1.饼状图
如果你想展示部分和整体的关系,那饼图绝对是不二之选。饼图可以突出一个项目占所有项目之和的百分比情况。
使用时,需注意:
须确认各个扇形的数据加起来等于100%;
避免扇区超过5个,尽量让图表简洁明了;
注意扇形的排布顺序,一般情况下,将最大的扇形放在12点钟方向,接下来按面积依次排列;
最后,正确使用颜色,既区分出需要强调的扇形,又不致于让人眼花缭乱。
2.华夫饼图(Waffle Chart)
又称为直角饼图,可以直观的描绘百分比完成比例情况。
与传统的饼图相比较,华夫饼图表达的百分比更清晰和准确,它的每一个格子代表 1%。华夫饼图的典型应用是比较同类型指标完成比例。
3.子弹图
子弹图的发明是为了取代仪表盘上常见的那种里程表,时速表等基于圆形的信息表达方式。
每一个单元的子弹图只能显示单一的数据信息源;通过添加合理的度量标尺可以显示更精确的阶段性数据信息;通过优化设计还能够用于表达多项同类数据的对比;可以表达一项数据与不同目标的校对结果。
4.仪表盘
直观的表现出某个指标的进度或占比情况。
第四类:结构图
1.漏斗图
形如“漏斗”,用于单流程分析,在开始和结束之间由N个流程环节组成。
漏斗图最适宜用来呈现业务流程的推进情况,如用户的转化情况。通过漏斗图,可直观的看出流程中各部分的占比、发现流程中的问题,进而做出决策。
漏斗图的起始总是100%,并在各个环节依次减少,各个环节,有逻辑上的顺序关系。
2.甘特图
普通图表,又称为横道图、条状图(Bar chart)。其通过条状图来显示项目、进度和其他时间相关的系统进展的内在关系随着时间进展的情况。
3.树图
统计图表,又叫矩形树图,是一个由不同大小的嵌套式矩形来显示树状结构数据。
在矩形树图中,父子层级由矩形的嵌套表示。在同一层级中,所有矩形依次无间隙排布,他们的面积之和代表了整体的大小。
单个矩形面积由其在同一层级的占比决定。
4.旭日图
普通图表,是一种表现层级数据的图表。
它以父子层次结构来显示数据,并构成一个同心圆,因此又被成为称为多层饼图。离原点越近,数据的层级越高。
旭日图的本质是树状关系,与树图等价的,因此也被称为极坐标下的矩形树图。它可以在承载大量数据的同时,清晰的显示数据间的结构关系。
第五类: 关联型
表达多个数据之间的联系常用散点图、气泡图等。
1.散点图
将所有的数据以点的形式展现在平面直角坐标系上。
散点图通常用于显示和比较数值,例如科学数据、统计数据和工程数据。
在不考虑时间的情况下比较大量数据时,请使用散点图。
散点图中包含的数据越多,比较的效果就越好。
2.气泡图
可以看作是散点图的变形。
气泡图通常用于展示和比较数据之间的关系和分布,通过比较气泡位置和大小来分析数据维度之间的相关性。
也可以用作研究两个变量与时间变量的关系。如果再多一维变量,还可以使用颜色区分。
3.弦图
普通图表,是一种表示实体之间相互关系的图形方法。
就场景而言,弦图最常被用来表现复杂的关系、以及数据的流动情况等。
第六类: 分布型
1.直方图
统计图表,用于表示数据的分布情况。直方图与柱状图看似相像,实则完全不同。
前者反映数据分布情况,后者则不具备此功能,只能对数值进行比较。
从数据结构来说,柱状图需要1个分类变量,是离散的,柱子间有空隙。但直方图的数据均为连续的数值变量,因此柱子间是没有空隙的。
直方图一般用于单个变量,如果是多个变量可以使用多变量直方图。
2.核密度曲线
统计图表,也是用于表示数据的分布情况。
KDE图不是使用离散分箱,而是使用高斯核平滑产生连续密度估计。
它也很像普通的曲线图,但是要记住它一条线是一个变量,曲线图是两个变量。如果要表达多个变量可以使用等高线图或者峰峦图(joyplot)。等高线图是二元变量,峰峦图是多元变量,但是变量数最好不要超过八个,图会很难看。
第七类 :聚类
1.平行坐标图
统计图表,含有多个垂直平行坐标轴图表。
随着数据增多,折线堆叠,分析者则有可能从中发现特性和规律,比如发现数据之间的聚类关系。
2.树状图
跟树图表示占比的含义完全不同,这里是聚类图形。相同的子树在一个分支下,直观的显示聚类关系和层次关系。
3.簇状图
可用于划分属于同一群集的点,用SPSS画。
第八类: 离群型
1.热力图
热力图主要通过颜色表现数值的大小(两个维度),一般用于活跃程度的体现,可以直观清楚地看到数据密集情况。
适合用于查看总体的情况、发现异常值、显示多个变量之间的差异,以及检测它们之间是否存在任何相关性。
绘图时,需指定颜色映射的规则。例如,较大的值由较深的颜色表示,较小的值由较浅的颜色表示;较大的值由偏暖的颜色表示,较小的值由较冷的颜色表示。
2.K线图
普通图表,适合的数据,一个时间数据字段,五个连续字段。多个放在一起可以观察数据的变化、对比和趋势分类数值大小。单个可以用做箱型图,来观察离群值。
3.箱形图
统计图表,一种用作显示一组数据分布情况,它能显示出一组数据的最大值、最小值、中位数及上下四分位数。从箱子延伸出去的线条展现出了上下四分位数以外的数据,这代表离群值,也可称之为异常值。框的不同部分之间的间距表示数据中的分散程度(扩散)和偏斜,并显示离群值。
4.小提琴图
和箱线图有点儿类似,用来显示数据分布和概率密度。
这种图结合了箱线图和密度图的特征,用来显示数据的分布形状。它可以很直观的显示离群值的位置。
二、图表选择困难症?不怕,这有良药!
如果看到这了,还是存在图表选择困难症,那就接着往下看。
其实,选择图表有门道:要以目的为导向。
选之前,先问自己一个问题:我想用图表向读者传达什么信息?
在选择图表时,要尽可能的理解每个图表的元素和可表达可视化作用,这样才做出兼具实用性和美观性的图表。
最后,就是多多去尝试。
因为每个图表核心可能是表达一个功能,但如果与其他元素结合也可以具备多个功能。
比如柱状图最核心是对比/比较,但是如果与时间相结合呢?就有趋势的功能;如果堆叠起来呢?就有了占比的功能。
环形图单个表示占比,两个表示对比,与时间结合就可能表示趋势了。
如果....还是不会选的话,那小编就建议您舍繁从简,就老老实实用折线图、饼图、柱状图、面积图、散点图...这几种吧,反正它们基本把以上八种图表的功能给囊括啦~
最后,请欣赏下小编在伙伴云上制作的图表“大作”吧~
上述就是小编为大家整理的数据分析人士必知:图表类型有哪些,分析不同数据怎么用相关内容。
国内(北京、上海、广州、深圳、成都、重庆、杭州、西安、武汉、苏州、郑州、南京、天津、长沙、东莞、宁波、佛山、合肥、青岛)伙伴云软件分析、比较及推荐。
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。