别再找了!全网最全的数据分析全流程攻略在这

网友投稿 589 2022-05-29

试想这样一个场景:

领导说:“你去建材市场帮我买些配件。”你顶着烈日跑遍大小市场,但领导问你:“为何选这家?”你却答不上来。

你没努力吗?努力了。但有成效吗?至少在领导眼中,你满身大汗毫无意义。

其实,做数据分析工作也是这样的道理。当领导给你一个任务时,你毫无章法只顾一股脑搜集数据时,最后得出的工作结果也是一样毫无意义。

今天,我们从头到尾,好好梳理一下数据分析的全流程。

在领导给出任务时,我们应该在脑海中反复问问题。搞新闻的人都知道5W1H,这种分析方法在数据分析时同样适用。

What:什么事情、Where:什么地点、When:什么时候、Who:什么人、Why:什么原因、How:如何做。

当我们把这6个问题分析透彻,自然就找到了搜集数据的切入点,而不是在海量复杂的数据中大海捞针。

别再找了!全网最全的数据分析全流程攻略在这

这一步结束时,我们便可以明确数据分析流程:第一步是拿数据,第二步是分析数据,第三步是得出结论。

面对海量的数据,我们从哪里拿?怎么拿?在这一步时,我们应该将其进一步细分为搭建数据框架和提取数据。

搭建框架是数据分析的基本功之一,每当产生新的业务需求时,都应该通过框架进行思考,这对解决问题起着至关重要的作用。

通过上一步骤,我们拿到了数据,但这些数据一定能直接用吗?并不是,我们还需要进行数据预处理,将无用的数据处理掉,拿到干净的重要数据进行分析。

进行到这一步时,我们还需要掌握足够的分析方法,今天我们了解一下常用的6个分析方法。

分类分析:分类是一种基本的数据分析方式,根据其特点,可将数据对象划分为不同的部分和类型,再进一步分析,能够进一步挖掘事物的本质。

矩阵分析:在矩阵图的基础上,把不同元素分别放在行和列,然后在行和列的交叉点中,用数量描述这些因素之间的对比,再进行数量计算、定量分析,确定哪些因素最重要。

漏斗分析:分析问题的本质是把问题进行拆解,将复杂的问题拆分为小问题。漏斗分析便是一套流程分析,主要适用于流程较长,环节较多,并且随着环节进行流量逐渐流失的场景。

相关分析:对总体中确实具有联系的标志进行分析,其主体是对总体中具有因果关系标志的分析。它是描述客观事物相互间关系的密切程度并用适当的统计指标表示出来的过程。

逻辑树分析:把一个已知问题当成树干,然后开始考虑这个问题和哪些相关问题或者子任务有关。每想到一点,就给这个问题加一个“树枝”,并标注这个“树枝”代表什么问题。

趋势分析:通过对有关指标的各期对基期的变化趋势的分析,从中发现问题,为追索和检查账目提供线索的一种分析方法,趋势分析法可用相对数也可用绝对数。

数据分析工作进行到这一步,便到了收尾、汇报阶段,也就是得出结论。在过去的工作中,我们可能会采取Excel表格汇报工作。但这有一个非常大的问题:找不到主次和痛点。

因此,现在数据分析师大多采用可视化报表汇报工作。在制作报表时,应该尽可能多的使用柱状图、饼图、折线图等形式进行解释说明,这样能够直观展现出数据分析的结果,而不是用自己的主观感受汇报工作。

制作可视化报表可以采用Yonghong Desktop,这款产品不仅对新手非常友好,更是全功能永久免费提供,不管是刚刚开始学习数据分析的人,还是专业的数据分析师,都可以用它来制作可视化报表汇报工作。

Yonghong Desktop内置多种主题风格

这样以来,通过柱状图中最高的那一条、线图中波动最大的那一段,我们一眼就能看到问题出现在哪里。

当然了,光有顺手的工具还不够,制作可视化报表可是门艺术活,这不光需要你有强大的逻辑,懂得安排图表位置,还要有良好的审美,从配色、字体等多角度切入,制作观赏性强、实用性强的可视化报表。

数据分析需要持久深入学习,有了得心的工具,我们也要掌握足够多、足够有效的方法论。接下来,给大家推荐一些好物。

书籍:

数据分析入门阶段:

《深入浅出数据分析》

《谁说菜鸟不会数据分析》

《赤裸裸的统计学》

数据分析进阶阶段:

《精通web analytics 2.0》

《网站分析实战》

《深入浅出统计学》

《数据化管理》

《SQL从入门到精通》

《数据运营手册:方法、工具、案例》

数据分析高阶阶段:

《决战大数据》

《精益数据分析》

《TheWall Street Journal Guide to Information Graphics》

数据仓库经典教程》

应用与数据集成平台 ROMA Connect 数据挖掘

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:【Python3网络爬虫开发实战】1.7.2-mitmproxy的安装
下一篇:GaussDB(DWS)负载管理架构、基本概念和场景
相关文章