PDF转Excel:高效去除AI特征,实现数据自由编辑
626
2022-11-28
本篇文章给大家谈谈excel数据分析自学,以及利用excel分析数据对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。 今天给各位分享excel数据分析自学的知识,其中也会对利用excel分析数据进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!
本文目录一览:
1、怎样用Excel做数据分析
2、一般用excel怎么做数据分析
3、【数据分析】Excel数据分析全流程
4、零基础学数据分析应该怎么入门
前言
最近松懈了,花了很多时间在玩游戏看视频上,把学习计划耽搁了,总说要自律,但光说不做是没用的,最主要是自控能力太差了,得承认自己和大多数人一样,爱玩、不愿意迈出舒适区,“知行合一”,只四个字,大道至简,却超过99%的人都做不到。在前进的路上,希望自己能克服惰性,提升自控力,按计划耐心学习并践行。
1、数据分析步骤:
提出问题→理解数据→数据清洗→构建模型→数据可视化
2、实践案例:
利用一份招聘网站的数据作为实战案例。
第一步提出问题:
1)在哪些城市找到数据分师工作的机会比较大?
2)数据分师的薪水如何?
3)根据工作经验的不同,薪酬是怎样变化的?
第二步理解数据:
初始数据有6875条,14项内容。
设置表格列宽(步骤如下图),显示全部内容,方便后续操作,最后保存。
第三步清洗数据:
这一步需要花费的时间占大部分,把数据处理成自己想要的样子。
1、选择子集:选择公司全名和公司ID两列并隐藏(取消隐藏方法:全选表格→开始→格式→隐藏和取消隐藏→取消隐藏列)
2、列名重命名:双击列名可以修改成自己想要的列名。
3、删除重复值:选择职位ID将其重复值删除(步骤如下图)
4、缺失值处理:选择职位ID列计数5032,选择城市列计数5030,城市列缺失两个数据。
查找并定位城市列的缺失值(步骤如下图),缺失值填上海。
缺失值处理的4种方法,根据情况灵活使用:
1)通过人工手动补全;
2)删除缺失的数据;
3)用平均值代替缺失值;
4)用统计模型计算出的值去代替缺失值。
5、一致化处理:对“公司所属领域”进行一致化处理(步骤如下图)
将原来的“公司所属领域”列隐藏,并将复制的列进行分列:
6、数据排序:
7、异常值处理:
第四步构建模型
第五步数据可视化
通过上面的分析,我们可以得到的以下分析结论有:
1)数据分析这一岗位,有大量的工作机会集中在北上广深以及新一线城市,如果你将来去这些城市找工作,可以提高你成功的条件概率。
2)从待遇上看,数据分析师留在深圳发展是个不错的选择,其次是北京、上海。
3)数据分析是个年轻的职业方向,大量的工作经验需求集中在1-3年。
对于数据分析师来说,5年似乎是个瓶颈期,如果在5年之内没有提升自己的能力,大概以后的竞争压力会比较大。
4)随着经验的提升,数据分析师的薪酬也在不断提高,10年以上工作经验的人,能获得相当丰厚的薪酬。
3、划重点:
1)分列功能会覆盖掉右列单元格,所以我们记得先要复制这一列到最后一个空白列的地方,再进行分列操作。
2)上面图片中的函数:IF(COUNT(FIND({"数据运营","数据分析","分析师"},L2)),"是","否")。
3)Ctrl+Eneter快捷键,在不连续的单元格中同时输入同一个数据或公式时很好用。
4)精确查找和近似查找(模糊查找)的区别
(1)精确查找是指从第一行开始往最后一行逐个查找。一找到匹配项就停止查询,所以返回找到的第一个值。
(2)当你要近似查找的时候,它就会苦逼地查遍所有的数据,返回的是最后一个匹配到的值。
5)在使用vlookup函数时,在很多情况下使用的是精确匹配,而在进行分组时需要用模糊匹配,所以这里要输入“1”来进行模糊匹配。
6)Excel设置了快捷键F4帮助用户迅速切换相对引用、绝对引用和混合引用,步骤如下:
(1)选定包含该公式的单元格;
(2)在编辑栏中选择要更改的公式内容,并按 F4 键;
(3)以引用单元格A1为例,每次按 F4 键时,Excel会依次在以下组合间切换:
按一次F4是绝对引用
按两次、三次F4是混合引用
按四次F4是相对引用
7)使用这个函数过程中,如果出现错误标识“#N/A”,一般是3个原因导致:
(1)第2个参数:查找范围里第一列的值必须是要查找的值。
比如这个案例里第2个参数选定的的范围里第一列是姓名,是要查找值的列。
(2)数据存在空格,此时可以嵌套使用TRIM函数将空格批量删除。
(3)数据类型或格式不一致,此时将数据类型或格式转为一致即可。
一般来说,需要学习一些Excel相关基本知识,运用Excel进行数据分析,就需要六个步骤,这六个步骤分别是明确分析的目的和思路、做好数据收集工作、数据处理、数据分析、数据展现、数据分析报告。
在数据分析工作之前的要有明确的分析目的,这是因为只有明确数据局分析的目的,才不会偏离数据分析的方向,在确定数据分析的目的以后,还要梳理好数据分析的框架,在确定好分析框架的体系以后,还需要结合实际情况去进行搭建分析框架。这样才能够保证数据的完整性。
而数据收集工作就需要明确数据了来源,一般来说,数据收集的途径有三种,第一种就是传统的手工录入数据,比如设置问卷调查表。第二种就是自动导入网上的数据,第三种就是导入文本数据。大家在进行数据收集工作的时候根据实际情况去进行数据收集方式的选择。
我们再来说说数据处理工作,数据处理工作有三个阶段,分别是数据清洗、数据加工、数据抽样。数据清洗工作就是用函数法和筛选法或者条件格式发去处理重复数据。使用定位输入或查找替换找到空白或以错误标识符显示的单元格,最常用的是以样本平均值代替缺失值,也可以用统计模型计算出来的值进行替换,或根据实际情况保留或删除缺失数据。利用IF函数检查错误或利用条件格式标记错误。而数据加工就有很多种方法,分别是数据抽取、数据计算、数据分组、数据转换。而数据抽样就是利用函数进行随机抽样。
接着我们说说数据分析,数据分析方法有很多,比如包括对比分析法、分组分析法、结构分析法、平均分析法、交叉分析法、综合评价分析法、杜邦分析法、漏斗图分析法等。而数据分析工具就是用Excel自带的分析工具就可以了,而这个自带的工具的功能是很强大的。
然后说说数据展现。一般情况下,能用图说明问题的就不用表格,能用表格说明问题的就不用文字。所以,数据展现使用图表是现在的主流方式,那么图表的作用是什么呢?图表的作用就是表达形象化、突出重点、体现专业化。经常用的图表的类型有表格、饼图、条形图、柱形图、折线图、散点图等。
最后就是数据分析的报告了,数据分析报告的要求就是需要有明确的结论,没有明确结论的分析称不上分析,同时也失去了报告的意义。
作为数据分析师excel数据分析自学, 清晰excel数据分析自学了解数据分析excel数据分析自学的步骤是非常重要的,有助于清楚把控整个数据分析的流程。
作为想要学习数据分析的人员,了解整个数据分析的流程, 这样在面对一个数据分析问题的时候,知道如何去开展。
那么数据分析流程包含哪些环节呢?
我将一次完整的数据分析流程主要分为六个环节,包括明确 分析目的、数据获取、数据处理、数据分析、数据可视化、总结与建议 。
做任何事情都有其对应的目的,数据分析也是如此。每一次分析前,都必须要先明确做这次分析的目的是什么,只有先明确了目的,后面的分析才能围绕其展开, 常见的数据分析目标包括以下三种类型excel数据分析自学:
指标波动型 : 主要是针对某个指标下降了,上涨或者异常所做的分析, 比如DAU(日活跃用户数)降低了, 留存率降低了, 电商平台的订单数量减少了, 收入降低了,质量指标如卡顿率上涨的,分析的主要目的是挖掘指标波动的原因, 及时发现业务的问题。
评估决策型 :主要是针对某个活动上线, 某个功能上线, 某个策略上线的效果评估以及下一步迭代方向的建议,这些建议是指导产品经理或者其他业务方决策的依据。
专题探索型 : 主要是针对业务发起的一些专题的分析, 比如增长类的专题分析, 怎么提高用户新增,活跃,留存,付费, 比如体验类的专题分析, 如何提高用户查找表情的效率, 比如方向性的探索, 微信引入视频号的功能的用户需求分析以及潜在机会分析。
明确了数据分析目的之后, 第二步就是根据我们的分析目的,提取相对应的数据,通常这一个环节是利用 hive sql 从数据仓库中提取数据。
提取的数据通常要注意提取的维度和对应的指标个数,以电商app 的付费流失严重分析案例,我们需要提取的维度和指标可以根据具体的业务流程来(如图):
首先从维度上,我们需要确定好,比如时间维度我们提取的时间跨度是多长,比如今天的数据和昨天的对比,那就是取2天的数据,如果是这周和上周那就是十四天的数据。
设备维度的值是否需要提取ios和安卓的用户进行不同的平台的对比,分析付费流失严重是否主要发生在某个平台。
年龄、性别、地域维度,就是提取用户这些维度的信息, 主要是为了在哪一个年龄层, 哪一个性别,哪一个地域流失最严重。
新老用户的维度, 主要是从新旧维度上分析流失严重是否是集中在新用户还是老用户(如图所示)
确定好了维度以后, 接下来就是指标信息, 维度+ 指标才是一个完整的数据 。
因为需要分析每一个环节的流失情况,所以需要提取下单的每一个环节对应的指标的人数和次数。
基于这些人数和次数,我们可以计算每一个环节之间的转化率。
活跃浏览比 = 浏览的人数/活跃的人数
浏览添加比 = 添加的人数/浏览的人数
添加下单比 = 点击下单人数/添加购物车人数
成功下单率 = 成功下单的人数/点击下单的人数
当我们知道我们应该从哪里获取数据, 以及获取哪些指标数据后,为了保证我们提取的数据的质量,我们通常要对数据进行处理。
常见的数据处理有异常值处理,空值处理。举个例子, 比如我们在提取用户的年龄数据之前,我们需要去除掉年龄中的空的数据以及异常的数据, 异常的数据指得是比如年龄超过120岁这种。
数据处理好了之后,就可以开始分析,根据我们的分析目标,我们要选择合适的分析方法和分析思路去做拆解和挖掘。
常见的分析方法包括:漏斗分析, 相关性分析, 5w2h 分析, aha 时刻分析, 麦肯锡逻辑树分析法,用户画像分析,RFM用户分群,对比分析等方法,这些方法详细的介绍会在第三章展开, 在这里不做赘述
针对我们的订单流失的问题,典型的分析思路和方法是利用漏斗分析和用户画像分析。
漏斗分析主要是可以挖掘付费流失严重的主要流失环节是在哪里。我们发现付费流失严重主要是因为用户活跃到浏览商品的转化率从50%跌倒30%, 减少了20%,那就可以把问题定位到为什么用户浏览变少的问题上。
用户画像分析,可以帮助我们分析流失严重的用户是什么特征,比如什么样的年龄, 性别, 地域等, 那就可以知道这种流失是集中在哪一个年龄群体,哪一个地域群体以及其他的行为特征。
通过数据分析得出结论后,还需要用图表展示出来,俗话说得好,“文不如表,表不如图",用图表可以更清晰展现excel数据分析自学你的结论,通常的可视化我们可以利用excel 自带的可视化的功能, 也可以通过python或者R脚本进行可视化。
常见的图表有: 柱形图,折线图,饼图,条形图,面积图, 散点图,组合图,箱线图
当我们利用图表把我们的数据分析结论展示出来以后,最后就是数据分析的总结的部分,主要分成我们得出了什么具体的结论以及给业务具体的建议,告诉他们改进的方向。
这就是一次完整的数据分析的流程,从分析目的到提取数据,到分析数据给出结论的完整的过程。
数据科学是一门应用学科,需要系统提升数据获取、数据分析、数据可视化、机器学习的水平。下面就简单提供一个数据分析入门的路径:
第一阶段:Excel数据分析
每一位数据分析师都脱离不开Excel。excel是日常工作中最常用的工具,如果不考虑性能和数据量,可以应付绝大部分分析工作。虽然现在机器学习满地走,Excel依旧是无可争议的第一工具。
第二阶段:SQL数据库语言
作为数据分析人员,首先要知道如何去获取数据,其中最常见的就是从关系型数据库中取数,因此可以不会R,不会python,但是不能不会SQL。DT时代,数据正在呈指数级增长。Excel对十万条以内的数据处理起来没有问题,但是往小处说,但凡产品有一点规模,数据都是百万起。这时候就需要学习数据库。
第三阶段:数据可视化商业智能
数据可视化能力已经越来越成为各岗位的基础技能。领英的数据报告显示,数据可视化技能在历年年中国最热门技能中排名第一。
学习数据分析可以到CDA数据分析认证中心了解一下,CDA是大数据和人工智能时代面向国际范围全行业的数据分析专业人才职业简称,具体指在互联网、金融、咨询、电信、零售、医疗、旅游等行业专门从事数据的采集、清洗、处理、分析并能制作业务报告、提供决策的新型数据人才。 关于excel数据分析自学和利用excel分析数据的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。 excel数据分析自学的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于利用excel分析数据、excel数据分析自学的信息别忘了在本站进行查找喔。
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。