数据分析经典案例数据分析著名案例)

网友投稿 2478 2022-12-20

本篇文章给大家谈谈数据分析经典案例,以及数据分析著名案例对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。 今天给各位分享数据分析经典案例的知识,其中也会对数据分析著名案例进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!

本文目录一览:

有哪些大数据分析案例?

如下数据分析经典案例

1. 大数据应用案例之:医疗行业

1)Seton Healthcare是采用IBM最新沃森技术医疗保健内容分析预测数据分析经典案例的首个客户。该技术允许企业找到大量病人相关的临床医疗信息,通过大数据处理,更好地分析病人的信息。

在加拿大多伦多的一家医院,针对早产婴儿,每秒钟有超过3000次的数据读取。通过这些数据分析,医院能够提前知道哪些早产儿出现问题并且有针对性地采取措施,避免早产婴儿夭折。

它让更多的创业者更方便地开发产品,比如通过社交网络来收集数据的健康类App。也许未来数年后,它们搜集的数据能让医生给数据分析经典案例你的诊断变得更为精确,比方说不是通用的成人每日三次一次一片,而是检测到你的血液中药剂已经代谢完成会自动提醒你再次服药。

2)大数据配合乔布斯癌症治疗

乔布斯是世界上第一个对自身所有DNA和肿瘤DNA进行排序的人。为此,他支付了高达几十万美元的费用。他得到的不是样本,而是包括整个基因的数据文档。医生按照所有基因按需下药,最终这种方式帮助乔布斯延长了好几年的生命。

2. 大数据应用案例之:能源行业

1)智能电网现在欧洲已经做到了终端,也就是所谓的智能电表。在德国,为了鼓励利用太阳能,会在家庭安装太阳能,除了卖电给你,当你的太阳能有多余电的时候还可以买回来。

通过电网收集每隔五分钟或十分钟收集一次数据,收集来的这些数据可以用来预测客户的用电习惯等,从而推断出在未来2~3个月时间里,整个电网大概需要多少电。有了这个预测后,就可以向发电或者供电企业购买一定数量的电。

因为电有点像期货一样,如果提前买就会比较便宜,买现货就比较贵。通过这个预测后,可以降低采购成本。

2)丹麦的维斯塔斯风能系统(Vestas Wind Systems)运用大数据,系统依靠的是BigInsights软件和IBM超级计算机,分析出应该在哪里设置涡轮发电机,事实上这是风能领域的重大挑战。在一个风电场20多年的运营过程中,准确的定位能帮助工厂实现能源产出的最大化。

为了锁定最理想的位置,Vestas分析了来自各方面的信息:风力和天气数据、湍流度、地形图、公司遍及全球的2.5万多个受控涡轮机组发回的传感器数据。这样一套信息处理体系赋予了公司独特的竞争优势,帮助其客户实现投资回报的最大化。

3. 大数据应用案例之:通信行业—通过大数据分析挽回核心客户

法国电信-Orange集团旗下的波兰电信公司Telekomunikacja Polska是波兰最大的语音和宽带固网供应商,希望有效的途径来准确预测并解决客户流失问题。

他们决定进行客户细分,方法是构建一张“社交图谱”- 分析客户数百万个电话的数据记录,特别关注 “谁给谁打了电话”以及“打电话的频率”两个方面。“社交图谱”把公司用户分成几大类,如:“联网型”、“桥梁型”、“领导型”以及“跟随型”。

这样的关系数据有助电信服务供应商深入洞悉一系列问题,如:哪些人会对可能“弃用”公司服务的客户产生较大的影响?挽留最有价值客户的难度有多大?运用这一方法,公司客户流失预测模型的准确率提升了47%。

4、大数据应用案例之:零售业—大数据帮零售企业制定促销策略

北美零售商百思买在北美的销售活动非常活跃,产品总数达到3万多种,产品的价格也随地区和市场条件而异。由于产品种类繁多,成本变化比较频繁,一年之中,变化可达四次之多。

结果,每年的调价次数高达12万次。最让高管头疼的是定价促销策略。公司组成了一个11人的团队,希望透过分析消费者的购买记录和相关信息,提高定价的准确度和响应速度。

定价团队的分析围绕着三个关键维度:

1)数量:团队需要分析海量信息。他们收集了上千万的消费者的购买记录,从客户不同维度分析,了解客户对每种产品种类的最高接受能力,从而为产品定出最佳价位。

2)多样性:团队除了分析了购买记录这种结构化的数据外,他们也利用社交媒体发帖这种新型的非结构化数据。由于消费者需要在零售商专页上点赞或留言以获得优惠券,团队利用情感分析公式来分析专页上消费者的情绪,从而判断他们对于公司的促销活动是否满意,并微调促销策略。

3)速度:为了实现价值最大化,团队对数据进行实时或近似实时的处理。他们成功地根据一个消费者既往的麦片购买记录,为身处超市麦片专柜的他/她即时发送优惠券,为客户带来便利性和惊喜。

透过这一系列的活动,团队提高了定价的准确度和响应速度,为零售商新增销售额和利润数千万美元。

5、大数据应用案例之:网络营销行业(SEM)

很多企业在做SEM的过程中,都有这样的感触:每年都会花费大量的预算在SEM推广中,但是因为关键词投入产出无法可视化,常常花了很多钱却不见具体的回报。

在竞争如此激烈的SEM市场中,企业需要一个高效的数据分析工具来尽可能地帮企业优化SEM推广,例如BDP,来帮企业节省不必要的支出,提升整体的经营绩效。

企业可借助数据平台提供的网络营销整合解决方案,打通各个搜索引擎营销(SEM)、在线客服系统和CRM系统,营销竞价人员无需掌握复杂的编程技术,简单拖拽即可生成报表,观察每一个关键词的投入和产出,分析每一个页面的转化,有效降低投放成本。

通过BDP实况分析数据,可以快速洞悉对手关键词的投放时段、地域及排名,并对其进行可视化的分析,实时监控自己和竞争对手的投放情况,了解对手的投放策略,支持自定义设置数据更新的时间点、监控频次和时段,及时调整策略。知已知彼,才能百战不殆。

6、大数据应用案例之:电商行业

意料之外:胸部最大的是新疆妹子。曾经淘宝平台显示,中国女性购买最多的文胸尺码为B罩杯。B罩杯占比达41.45%,其中又以75B的销量最好,其次是A罩杯,购买占比达25.26%,C罩杯只有8.96%。

虽然淘宝数据平台不能代表一切,但是结合现实来看,这个也具有普遍的代表性,只能感慨中国女性普遍size。在文胸颜色中,黑色最为畅销,黑色绝对是百搭,每个女性必备。

从省市排名,胸部最大的是新疆妹子。这些数据都对于文胸店铺而言是很好的参考,为店铺的库存、定价、款式选择等策略都有奠定数据基础。

7、大数据应用案例之:娱乐行业

微软大数据成功预测奥斯卡21项大奖。2013年,微软纽约研究院的经济学家大卫•罗斯柴尔德(David Rothschild)利用大数据成功预测24个奥斯卡奖项中的19个,成为人们津津乐道的话题。

今年罗斯柴尔德再接再厉,成功预测第86届奥斯卡金像奖颁奖典礼24个奖项中的21个,继续向人们展示现代科技的神奇魔力。

总的来说,大数据的终极目标并不仅仅是改变竞争环境,而是彻底扭转整个竞争环境,带来新机遇,企业需要应势而变。企业只有认识到这一点,使用合适的数据分析产品、聪明地使用和管理数据,才能在长期竞争中成为终极赢家。

数据分析的案例

沃尔玛经典营销案例:啤酒与尿布
“啤酒与尿布”的故事产生于20世纪90年代的美国沃尔玛超市中,沃尔玛的超市管理人员分析销售数据时发现了一个令人难于理解的现象:在某些特定的情况下,“啤酒”与“尿布”两件看上去毫无关系的商品会经常出现在同一个购物篮中,这种独特的销售现象引起了管理人员的注意,经过后续调查发现,这种现象出现在年轻的父亲身上。
在美国有婴儿的家庭中,一般是母亲在家中照看婴儿,年轻的父亲前去超市购买尿布。父亲在购买尿布的同时,往往会顺便为自己购买啤酒,这样就会出现啤酒与尿布这两件看上去不相干的商品经常会出现在同一个购物篮的现象。如果这个年轻的父亲在卖场只能买到两件商品之一,则他很有可能会放弃购物而到另一家商店, 直到可以一次同时买到啤酒与尿布为止。沃尔玛发现了这一独特的现象,开始在卖场尝试将啤酒与尿布摆放在相同的区域,让年轻的父亲可以同时找到这两件商品,并很快地完成购物;而沃尔玛超市也可以让这些客户一次购买两件商品、而不是一件,从而获得了很好的商品销售收入,这就是“啤酒与尿布” 故事的由来。
当然“啤酒与尿布”的故事必须具有技术方面的支持。1993年美国学者Agrawal提出通过分析购物篮中的商品集合,从而找出商品之间关联关系的关联算法,并根据商品之间的关系,找出客户的购买行为。艾格拉沃从数学及计算机算法角度提 出了商品关联关系的计算方法——Aprior算法。沃尔玛从上个世纪 90 年代尝试将 Aprior 算 法引入到 POS机数据分析中,并获得了成功,于是产生了“啤酒与尿布”的故事。
Suncorp-Metway使用数据分析实现智慧营销
Suncorp-Metway是澳大利亚一家提供普通保险、银行业、寿险和理财服务的多元化金融服务集团, 旗下拥有5个业务部门,管理着14类商品,由公司及共享服务部门提供支持,其在澳大利亚和新西兰的运营业务与900多万名客户有合作关系。
该公司过去十年间的合并与收购,使客户群增长了200%,这极大增加了客户群数据管理的复杂性,如果解决不好,必将对公司利润产生负面影响.为此,IBM公司为其提供了一套解决方案,组件包括:IBM Cognos 8 BI、IBMInitiate Master Data Service谀IBM Unica。
采用该方案后,Suncorp-Metway公司至少在以下三项业务方面取得显著成效:
1、显著增加了市场份额,但没有增加营销开支;
2、每年大约能够节省1000万美元的集成与相关成本;
3、避免向同一户家庭重复邮寄相同信函并且消除冗余系统,从而同时降低直接邮寄与运营成本。
由此可见,Suncorp-Metway公司通过该方案将此前多个孤立来源的数据集成起来,实现智慧营销,对控制成本,增加利润起到非常积极的作用。
数据分析帮助辛辛那提动物园提高客户满意度
辛辛那提动植物园成立于1873年,是世界上著名的动植物园之一,以其物种保护和保存以及高成活率繁殖饲养计划享有极高声誉。它占地面积71英亩,园内有500种动物和3000多种植物,是国内游客人数最多的动植物园之一,曾荣获Zagat十佳动物园,并被《父母》(Parent)杂志评为最受儿童喜欢的动物园,每年接待游客130多万人。
辛辛那提动植物园是一个非营利性组织,是俄亥州同时也是美国国内享受公共补贴最低的动植物园,除去政府补贴,2600万美元年度预算中,自筹资金部分达到三分之二以上。为此,需要不断地寻求增加收入。而要做到这一点,最好办法是为工作人员和游客提供更好的服务,提高游览率。从而实现动植物园与客户和纳税人的双赢。
借助于该方案强大的收集和处理能力、互联能力、分析能力以及随之带来的洞察力,在部署后,企业实现了以下各方面的受益:
·帮助动植物园了解每个客户浏览、使用和消费模式,根据时间和地理分布情况采取相应的措施改善游客体验,同时实现营业收入最大化。
·根据消费和游览行为对动植物园游客进行细分,针对每一类细分游客开展营销和促销活动,显著提高忠诚度和客户保有量。.
·识别消费支出低的游客,针对他们发送具有战略性的直寄广告,同时通过具有创意性的营销和激励计划奖励忠诚客户。
· 360度全方位了解客户行为,优化营销决策,实施解决方案后头一年节省40,000多美元营销成本,同时强化了可测量的结果。
·采用地理分析显示大量未实现预期结果的促销和折扣计划,重新部署资源支持产出率更高的业务活动,动植物园每年节省100,000多美元。
·通过强化营销提高整体游览率,2011年至少新增50,000人次“游览”。
·提供洞察结果强化运营管理。例如,即将关门前冰激淋销售出现高潮,动植物园决定延长冰激淋摊位营业时间,直到关门为止。这一措施夏季每天可增加2,000美元收入。
·与上年相比,餐饮销售增加30.7%,零售销售增加5.9%。
·动植物园高层管理团队可以制定更好的决策,不需要 IT 介入或提供支持。
·将分析引入会议室,利用直观工具帮助业务人员掌握数据。

值得膜拜的三个数据分析案例

值得膜拜的三个数据分析案例
今天给大家分享三个数据分析的经典案例,主要是学习其中的思路,当故事看吧,不要拘泥于文中故事的真实性。每个故事我简单的做一个点评吧
1、数据分析大神 高手在民间
这天,新上任的邢县长到小吃摊吃早餐,刚找个板凳坐下,就听炸油条的胡老头一边忙活一边唠叨:“大家吃好喝好哦,城管要来撵摊儿了,起码三天你们捞不着吃咱炸的油条了!”
邢县长心里一惊:省卫生厅领导最近要来视察,昨天下午县里才决定明后两天开展突击整治,这老头儿怎么今天一早就知道了?
哪料这件事还没弄明白,另一件事儿让县长脑袋里的问号更大了。一天,他照例到胡老头这儿吃油条。没想到,老头居然又在发布消息:“上面马上要来青天大老爷了!谁有什么冤假,就去县府宾馆等着吧!”
邢县长又是吃惊,又是恼怒。省高院的工作组星期三要来清查积案,这个消息昨天晚上才在常委会上传达,这老儿咋这么快就知道了呢?让他更吃惊的是,这老家伙不但对大领导们的行程了如指掌,就连派出所要突击检查娱乐场所这样的绝密行动,他都知道得清清楚楚。
一个大字不识的老头儿,居然能知道这么多政府内部消息,毫无疑问,定是某些政府工作人员保密意识太差,嘴巴不紧。于是,他立即召开会议,把那些局长、主任狠批了一通。与会领导个个低着头、不敢出声。
还是公安局长胆大,忍不住问道:“邢县长,这胡老头儿的事是您亲眼所见,还是道听途说来的?”
邢县长声色俱厉地一拍桌子:“都是我亲耳听到的!我问你,你们城关派出所今天晚上是不是要清查娱乐城?”
公安局长一脸尴尬,楞在那里。邢县长气恼地当即下令:“你亲自去查查这老头儿到底什么背景,明天向我汇报!”公安局长赶紧换上便装,立马跑到胡老头那儿进行暗访。没想到,老家伙正在向大伙儿发布新闻:“城关镇的镇长最近要倒霉了。大伙等着瞧,事儿不会小的……”
公安局长一听,很是诧异。于是,他运了口气,腆着笑脸,装傻卖呆似的问道:“你咋知道的?难道你儿子是纪委书记?”
胡老头呵呵一笑:“我咋知道的?那孙子以前吃我的油条,都是让司机开专车来买,这两天一反常态,竟然自己步行来吃,还老是一脸愁容。那年他爹死,都没见他那么难受过。能让那孙子比死了爹还难受的事,除了丢官儿,还能是啥?”
局长听了,暗自吃惊,这老头儿还真有两下子。于是他不动声色继续问道:“那昨天派出所清查娱乐城,你是咋知道的?”
胡老头又是一笑:“你没见那几家娱乐城一大早就挂出了停业修缮的牌子?人家有眼线,消息比咱灵通!”
“那卫生厅领导来视察,你是咋知道的?”
胡老头儿说:“除了上面来人检查,你啥时见洒水车出来过?”。
最后,局长问了个他最想不通的问题:“上次省高院的工作组来指导工作,你咋那么快就得到消息了呢?”
胡老头撇了撇嘴说:“那就更简单了。俺邻居家有个案子,法院拖了八年不办。那天,办案的法官突然主动来访,满脸笑容问长问短,还再三保证案子马上解决。这不明摆着上面来了人,怕他们上访嘛!”
局长佩服得五体投地,连忙一路小跑赶回去,把情况向邢县长汇报。县长听了,大动肝火,马上再次召开会议,做了四个小时的训话:“同志们,一个炸油条的都能从一些简单现象中,看出我们的工作动向,这说明了什么?说明我们存在太多的形式主义。这种恶习不改,怎么能提升政府形象?从今天开始,哪个部门再因为这种原因泄密,让那老头‘未卜先知’,我可就不客气!”
次日一早,邢县长又来到胡老头儿这儿吃油条,想验证一下开会的效果。没想到胡老头居然又在发布最新消息:“今天,上面要来大领导了,来的还不止一个!”
邢县长这一惊,真是非同小可。下午,市长要陪同省领导来检查工作,自己昨晚才接到通知,这老头咋又提前知道了?
邢县长强压怒火,问胡老头:“你说要来大领导,到底有多大呢?”
胡老头儿头也不抬地回答:“反正比县长还大!”
邢县长又问:“你说要来的不止一个,能说个准数吗,到底来几个?”
胡老头儿仰起头想了想,确定地回答:“四个!”
邢县长目瞪口呆,上级领导还真是要来四个!他心里怦怦直跳,又问:“胡……胡师傅,这些事儿你是怎么知道的?而且知道的这么准确。”
胡老头儿淡淡一笑:“这还不容易?我早上出摊儿,见县府宾馆的保安都戴上了白手套,一个个如临大敌,肯定是上面来人了。再看看停车场,书记、县长的车都停在了角落里,肯定是来了比他们大的官儿。再仔细看看,书记、县长停的车位是5号、6号,说明上面来了四个领导。你信不信?当官儿的和咱老百姓不一样,上厕所都要讲究个级别、排个先后顺序呢!”
邢县长听罢,张着塞满油条的大嘴,一动不动,好像僵化了似的…
(本故事来自于网络)
启示:
与其说高手来自于民间,还不如说生活是我们数据分析的基本素材,善于观察、善于整理关联信息才是我们做数据分析人员应该掌握的基本技能。可是啊,很多人忽略了我们身边的生活常识,不去思考,人云亦云,就像网上的这个全国离婚率排行榜数据,很多人首先不是思考数据的准确性,而是感叹世风日下。

想想吧,在你的生活圈子中,每3对夫妻就有1对离婚的吗?如果答案为“是”,我只能说,贵圈真乱!哈哈哈
2、林彪的数据挖掘本领
1948年辽沈战役开始之后,在东北野战军前线指挥所里面,每天深夜都要进行例常的“每日军情汇报”:由值班参谋读出下属各个纵队、师、团用电台报告的当日战况和缴获情况。
那几乎是重复着千篇一律的枯燥无味的数据:每支部队歼敌多少、俘虏多少;缴获的火炮、车辆多少、枪支、物资多少….
司令员林彪的要求很细,俘虏要分清军官和士兵,缴获的枪支,要统计出机枪、长枪、短枪;击毁和缴获尚能使用的汽车,也要分出大小和类别。
经过一天紧张的战斗指挥工作,人们都非常疲劳。整个作战室里面估计只有定下这个规矩的司令员林彪本人、还有那个读电报的倒霉参谋在用心留意。
1948年10月14日,东北野战军以迅雷不及掩耳之势,仅用了30小时就攻克了对手原以为可以长期坚守的锦州并全歼了守敌十余万之后,不顾疲劳,挥师北上与从沈阳出援的敌精锐廖耀湘基团二十余万在辽西相遇,一时间形成了混战。战局瞬息万变,谁胜谁负实难预料。
在大战紧急中,林彪无论有多忙,仍然坚持每晚必作的“功课”。一天深夜,值班参谋正在读着下面某师上报的其下属部队的战报。说他们下面的部队碰到了一个不大的遭遇战,歼敌部分、其余逃走。与其它之前所读的战报看上去并无明显异样,值班参谋就这样读着读着,林彪突然叫了一声“停!”他的眼里闪出了光芒,问:“刚才念的在胡家窝棚那个战斗的缴获,你们听到了吗?”
大家带着睡意的脸上出现了茫然,因为如此战斗每天都有几十起,不都是差不多一模一样的枯燥数字吗?林彪扫视一周,见无人回答,便接连问了三句:
“为什么那里缴获的短枪与长枪的比例比其它战斗略高”?
“为什么那里缴获和击毁的小车与大车的比例比其它战斗略高”?
“为什么在那里俘虏和击毙的军官与士兵的比例比其它战斗略高”?
人们还没有来得及思索,等不及的林彪司令员大步走向挂满军用地图的墙壁,指着地图上的那个点说:“我猜想,不,我断定!敌人的指挥所就在这里!”
随后林彪口授命令,追击从胡家窝棚逃走的那部分敌人,并坚决把他们打掉。各部队要采取分割包围的办法,把失去指挥中枢后会变得混乱的几十万敌军切成小块,逐一歼灭。司令员的命令随着无线电波发向了参战的各部队….
而此时的廖耀湘,正庆幸自己刚刚从偶然的一场遭遇战中安全脱身并与自己的另外一支部队汇合。他来不及休息就急于指令各部队尽快调整部署,为下一阶段作准备。可是好景不长,紧追而来的解放军迅速把他的新指挥部团团围住,拼命攻击,漫山遍野的解放军战士中,不断有人喊着:“矮胖子,白净脸;金丝眼镜湖南腔,不要放走廖耀湘!”
把对方指挥官的细节特征琢磨到如此细微,并变成如此威力巨大的顺口溜,穿着满身油渍伙夫服装的廖耀湘只好从俘虏群中站出来,无奈的说“我是廖耀湘”,沮丧的举手投降。
廖耀湘对自己静心隐蔽的精悍野战司令部那么快就被发现、打掉,觉得实在不可思议,认为那是一个偶然事件,输得不甘心。当他得知林彪是如何得出判断之后,这位出身黄埔军校并留学法国著名的圣西尔军校,参加过滇缅战役,在那里把日本鬼子揍得满地乱爬的新六军军长说,“我服了,败在他手下,不丢人。”
取得这场重要战役胜利的其中一个关键因素,居然出于获胜方的统帅夜半时分,对一份普通遭遇战之后的战报的数据分析,来源于他“从红军带兵时起,身上有个小本子,上面记载着每次战斗的缴获、歼敌数量”的优良军事素养。
(本故事来源于黄勇-丰沃华的博客)
启示:
林彪问的三个问题其实就是根据自己的数据库做的对比、细分、溯源。我们很多人把数据分析完全交给机器了,忘了我们自己的大脑也是一台紧密的数据分析机器。
数据的积累、数据的挖掘,分析、归纳、整理,是数据分析师所必须俱备的基本素养,没有它,你永远是匹夫之勇。
3、蛋挞与曼城队
2011年夏天,曼城队助理教练大卫·普拉特决定利用数据分析来解决球队在表现方面遇到的一个棘手难题。普拉特发现,尽管球队阵容中拥有多名高大强壮的球员,但他们的角球得分情况却不尽如人意。
在征求了俱乐部内部数据分析师的意见后,该队增加了对内旋角球(球转向守门员方向)的使用。战术转变产生了惊人的效果。在整个赛季中,曼城队依靠角球打入15个进球,成为英超角球得分效率最高的球队,其中2/3的进球采用的是内旋角球。
这一实践为数据驱动型决策提供了强有力的支撑。但是,还有一个附加因素需要考虑:主教练曼奇尼最初对数据的实际价值持怀疑态度。事实上,早在两年前,曼奇尼曾就球队角球的使用情况咨询过俱乐部的数据分析师。分析师回应,他依靠直觉偏爱采用的战术——外旋角球(球飞向远离守门员的方向)从数据统计上看并不理想。
曼奇尼选择相信自己的直觉而非数据分析的导向性建议。因为直觉告诉他,球旋向远离门将的方向减小了门将触球的概率,同时增加了进攻队员冲顶时争到头球的概率。但当曼奇尼发现两种变数存在某种联系的时候,直觉却模糊了他对两者关联程度的判断能力。换句话说,外旋角球和进球数可能存在着某种关联,但数据表明,内旋角球和进球数存在着更为直接的因果关系。
这一案例研究为我们改善商业决策带来哪些启示?一家美国零售商最近发现,两种不同变数之间存在着某种有趣的联系。当天气变冷,肉桂葡式蛋挞的销量上升500%——并非所有的葡式蛋挞,只是肉桂这一个品种。面对这种零星数据,零售商要做出抉择。每当预测天气即将转冷时,应该储备多少肉桂葡式蛋挞?还有一家零售商发现,羊奶干酪打折似乎能促进红酒的销售。希望减小红酒库存的时候,是不是应考虑羊奶干酪打折这种方法?
这两个问题的答案取决于大数据分析的核心问题:弄清相关性与因果关系之间的区别。人类善于发现事物的相关性——这是进化的特征——但是却在发掘直接相关事物的关系时显得有些笨拙。将相关性误解为因果关系所做出的决策是危险的,可能会遭受惨败,因为你所期待看到的影响可能并不会发生。
最近的一项研究显示,某国的巧克力销量与诺贝尔奖的人均比例之间呈现明显的相关性。各国是不是都该鼓励公民增加巧克力的消费来提高获得诺贝尔奖的人数呢?
为有效利用大数据,相关性分析应仅作为一个出发点去考虑。如果两个变量存在关联,我们该如何应对?当然,政府在推行“巧克力替代教育”的政策之前,应当首先考虑一下其他因素。比方说,看看那些获得诺贝尔奖人数较多的国家相对教育水平和研究预算,与巧克力消费相比,这两个变量与获诺奖的因果关系显然更大。
同样,那些葡式蛋挞和羊奶干酪的零售商们在拥有十足把握以前,需要对他们的假设进行验证。比如说,在确定因果关系存在以前,考察一些商店肉桂葡式蛋挞的“库存积压”情况;或者采取打折销售羊奶干酪的方式,看看红酒销量是否真的增加。
事物之间可能存在着一些简单的因果关系,但公司需要清楚每种因果关系都可能产生意想不到的结果。肉桂葡式蛋挞销量的增加是否意味着其他产品销量的减少?红酒销量的增加是否也意味着啤酒销量的减少或者牛排销量的增加?影响现代供应链的因素很多,而且还在不断增加:天气、社交媒体、特价商品、食品安全新闻等,都会影响消费者的行为,以及零售商应该购置多大规模的存货。这基本上就是一个混沌系统,完全准确地预测将来要发生的事情是不可能的。但模型越完善,预测就越准确,预测越准确,行动结果就越理想。
数据分析就像一幅印象派油画。当你退后观察,并把各个部分视作一个整体时,这幅画的意境才开始浮现,近距离观察是无法理解其中内涵的。这可以帮助我们解释为什么曼城队的新角球战术不太可能会长久取得良好的结果。实施从外旋角球到内旋角球的简单战术转变:多开点内旋球,少开点外旋球,这一简单的战术转变,亦会忽略了每场比赛中每次出现破门机会时的某些独特变数。
(这部分来源:商业价值)
结尾:
很多人把数据分析看的很难,其实数据分析存在于我们生活工作的每个角落。给大家几条建议:
1、多观察、善积累、勤思考。
2、不懂业务就不要做数据分析。
3、分析工具不要贪多,精通1-2个工具就行了。
4、数据分析是良心工程(自己理解)

什么是大数据,大数据的典型案例有哪些

"大数据"是一个体量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。 "大数据"首先是指数据体量(volumes)?大,指代大型数据集,一般在10TB?规模左右,但在实际应用中,很多企业用户把多个数据集放在一起,已经形成了PB级的数据量;其次是指数据类别(variety)大,数据来自多种数据源,数据种类和格式日渐丰富,已冲破了以前所限定的结构化数据范畴,囊括了半结构化和非结构化数据。接着是数据处理速度(Velocity)快,在数据量非常庞大的情况下,也能够做到数据的实时处理。最后一个特点是指数据真实性(Veracity)高,随着社交数据、企业内容、交易与应用数据等新数据源的兴趣,传统数据源的局限被打破,企业愈发需要有效的信息之力以确保其真实性及安全性。
数据采集数据分析经典案例:ETL工具负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。
数据存取数据分析经典案例:关系数据库、NOSQL、SQL等。
基础架构:云存储、分布式文件存储等。
数据处理:自然语言处理(NLP,NaturalLanguageProcessing)是研究人与计算机交互的语言问题的一门学科。处理自然语言的关键是要让计算机"理解"自然语言,所以自然语言处理又叫做自然语言理解(NLU,NaturalLanguage Understanding),也称为计算语言学(Computational Linguistics。一方面它是语言信息处理的一个分支,另一方面它是人工智能(AI, Artificial Intelligence)的核心课题之一。
统计分析:假设检验、显著性检验、差异分析、相关分析、T检验、方差分析、卡方分析、偏相关分析、距离分析、回归分析、简单回归分析、多元回归分析、逐步回归、回归预测与残差分析、岭回归、logistic回归分析、曲线估计、因子分析、聚类分析、主成分分析、因子分析、快速聚类法与聚类法、判别分析、对应分析、多元对应分析(最优尺度分析)、bootstrap技术等等。
数据挖掘:分类 (Classification)、估计(Estimation)、预测(Prediction)、相关性分组或关联规则(Affinity grouping or association rules)、聚类(Clustering)、描述和可视化、Description and Visualization)、复杂数据类型挖掘(Text, Web ,图形图像,视频,音频等)
模型预测:预测模型、机器学习、建模仿真。
结果呈现:云计算、标签云、关系图等。
要理解大数据这一概念,首先要从"大"入手,"大"是指数据规模,大数据一般指在10TB(1TB=1024GB)规模以上的数据量。大数据同过去的海量数据有所区别,其基本特征可以用4个V来总结(Vol-ume、Variety、Value和Veloc-ity),即体量大、多样性、价值密度低、速度快。
第一,数据体量巨大。从TB级别,跃升到PB级别。
第二,数据类型繁多,如前文提到的网络日志、视频、图片、地理位置信息,等等。
第三,价值密度低。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。
第四,处理速度快。1秒定律。最后这一点也是和传统的数据挖掘技术有着本质的不同。物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器,无一不是数据来源或者承载的方式。
大数据技术是指从各种各样类型的巨量数据中,快速获得有价值信息的技术。解决大数据问题的核心是大数据技术。目前所说的"大数据"不仅指数据本身的规模,也包括采集数据的工具、平台和数据分析系统。大数据研发目的是发展大数据技术并将其应用到相关领域,通过解决巨量数据处理问题促进其突破性发展。因此,大数据时代带来的挑战不仅体现在如何处理巨量

数据可视化的16个经典案例

[数据可视化]
本文编译自:Ross Crooks

数据可视化是指将数据以视觉的形式来呈现,如图表或地图,以帮助人们了解这些数据的意义。通过观察数字、统计数据的转换以获得清晰的结论并不是一件容易的事。而人类大脑对视觉信息的处理优于对文本的处理——因此使用图表、图形和设计元素,数据可视化可以帮你更容易的解释数据模式、趋势、统计数据和数据相关性,而这些内容在其他呈现方式下可能难以被发现。

数据可视化可以是静态的或交互的。几个世纪以来,人们一直在使用静态数据可视化,如图表和地图。交互式的数据可视化则相对更为先进:人们能够使用电脑和移动设备深入到这些图表和图形的具体细节,然后用交互的方式改变他们看到的数据及数据的处理方式。

我们必须用一个合乎逻辑的、易于理解的方式来呈现数据。但是,并非所有数据可视化作品的效果都一样好。那么,如何将数据组织起来,使其既有吸引力又易于理解?让我们通过下面的16个有趣的例子获得启发,它们是既注重风格也注重内容的数据可视化经典案例。

1:为什么会有“巴士群”现象
这里有一个关于复杂数据集的很好的例子,它看起来感觉像一个游戏。在这个例子里,Setosa网站为我们呈现了“巴士群”现象是如何发生的,即当一辆巴士被延迟,就会导致多辆巴士在同一时间到站。

只用数字讲述这个故事是非常困难的,所以取而代之的是,他们把它变成一个互动游戏。当巴士沿着路线旋转时,我们可以点击并按住一个按钮来使巴士延迟。然后,我们所要做的就是观察一个短暂的延迟如何使巴士在一段时间以后聚集起来。

2:世界上的语言
这个由DensityDesign设计的互动作品令人印象深刻,它将世界上众多(或者说,我们大多数人)语言用非语言的方法表现出来,一共有2678种。

这件作品可以让你浏览使用共同语言的家庭,看看哪些语言是最常用的,并查看语言在世界各地的使用范围。这是一种了不起的视觉叙事方法:将一个有深度的主题用一种易于理解的方式进行解读。

3:按年龄段分布的美国人口百分比
应该用什么方式去呈现一种单一的数据?这是一个令人信服的好榜样。

Pew Research创造了这个GIF动画,显示人口统计数量随着时间推移的的变化。这是一个好方法,它将一个内容较多的故事压缩成了一个小的动图包。此外,这种类型的微内容很容易在社交网络上分享或在博客中嵌入,扩大了内容的传播范围。

4:NFL(国家橄榄球联盟)的完整历史
体育世界有着丰富的数据,但这些数据并不总是能有效地呈现。然而,FiveThirtyEight网站做得特别好。

在下面这个交互式可视化评级中,他们对国家橄榄球联盟史上的每一场比赛计算“等级分” – – 根据比赛结果对球队实力进行简单的衡量 。总共有超过30,000个评级,观众可以通过比较各个队伍的等级分来了解每个队伍在数十年间的比赛表现。

5:Google Flights 上的美国感恩节
下面是将一段时间内在空中移动的物体进行可视化的好方法。这是由Google Trends驱动的项目,它跟踪感恩节前出发、到达和穿越美国的航班。

可视化始于当天很早的时间,随着时间的推移,像播放电影一样显示在全国各地飞行中的航班。不需要显示时间外的任何数字,观众即可以看到当天哪段时间是国际航班、国内航班以及往返于全国各地不同枢纽的航班的热门时间。

6:是什么真正造成了全球变暖?
我们都知道,“不要只简单地展示数据,讲个故事吧”。这正是彭博商业正在做的可视化 ——用互动的方式来讲述故事的来龙去脉。。

此图的关键是要反驳用自然原因解释全球变暖的理论。首先你会看到从1880年至今观测到的温度上升情况。为了使故事内容更加丰富,当你向下滚动时,这个可视化图会让你清楚的了解到相较于已被观测到的因素,造成全球变暖的不同因素到底有多少。作者希望观众能够得到非常清晰的结论。

7:在叙利亚,谁和谁在战斗?
许多不同的团体之间的关系可能令人很难理解 – 尤其是当有11个这样的团体存在的时候。这些团体之间有的结盟,有的敌对,反之亦然。这让人难以理解。

但是,Slate网站通过表格的形式和熟悉的视觉表达,将这些数据简化为一种简单的、易于理解和可交互的形式。观众可以点击任一张脸来查看双方关系的简要描述。

8:最有价值的运动队
这是通过叠加数据来讲述深层故事的一个典型例子。

这个交互由Column Five设计,受福布斯“2014年最具价值的运动队50强”名单得到的启发。但是它不仅将列表可视化,用户还可以通过它看到每支队伍参赛的时间以及夺得总冠军的数量。这为各队的历史和成功提供了更全面的概况信息。

9:美国风图
下面是一个类似感恩节航班的可视化图,除了图中显示的时刻,它还能实时显示美国本土的风速和风向。

它是直观设计的一个很好的案例:风速用线条移动的快慢来表示,方向通过线条移动的路径来表示。它会即时显示美国风向的总体趋势,无需任何数字,除非你在地图上点击鼠标。另外,使用时设定最多两个变量会使它更容易操作。
10:政治新闻受众渠道分布图
据Pew研究中心称,当设计师在信息内容很多又不能删的时候,他们通常会把信息放到数据表中,以使其更紧凑。但是,他们在这里使用分布图来代替。

为什么呢?因为分布图可以让观众在频谱上看到每个媒体的渠道。在分布图上,每个媒体的渠道之间的距离尤为显著。如果这些点仅仅是在表中列出,那么观众就无法看到每个渠道之间的对比效果。

11:著名创意人士的日程安排
这个数据可视化图是用奇特的想法描绘出的一个简单概念。这个表格利用Mason Currey的《日常惯例》一书中的信息展示了那些著名创意人士的日程安排,解读其时间和活动安排。这不仅是一个数据分析的例子(因为你可以通过单独的活动来浏览日程安排),也是一个品牌宣传的佳作。

12:今年发生了哪些新闻?
最好的数据可视化方式,就是用直观和美丽的方式传达信息。Echelon Insights致力于这一方式,将2014年Twitter上最受关注的新闻进行了可视化。

1亿8450万条推文是什么样子?就是如下图所示的艺术品。

13:问题的深度
当你想强调规模的时候,静态数据可视化是表达你的观点的极佳方式。下面这张来自《华盛顿邮报》的信息图长得令人难以置信…这是故意的。他们在图中展示了一架飞机可以探测到的深海信号是多么的深,通过比较飞机的探测深度与高层建筑、已知哺乳动物的最大深度、泰坦尼克号沉船的深度等。这是简单的视觉效果和颜色梯度的极佳使用方式。

最后,将数据添加到新闻报道中(文中为失踪的马航)是提供背景的好方式。

14:前沿预算
上述图表相对简单,以下是创造设计精致的、传递大量数据的图表的方法。秘诀何在?——用简单和干净的格式,便于读者理解数据。

这个由GOOD Magazine 和 Column Five制作的图表,解读了NASA的五年预算,显示资金将怎么花、花在哪里。此外,它还有一个主题设计,这真是一个全面成功的作品!

15: Kontakladen慈善年报
不是所有的数据可视化都需要用动画的形式来表达。当现实世界的数据通过现实生活中的例子进行可视化,结果会令人惊叹。设计师Marion Luttenberger把包含在Kontakladen慈善年报中的数据以一种独特的方法表现出来。

该组织为奥地利的吸毒者提供支持,所以Luttenberger就通过现实生活中的视觉元素来宣传他们的使命。例如,这辆购物车的形象表现出受助者每一天可以负担得起多少生活必需品。

16:奥地利太阳能年报
虽然有许多方法都能使数据可视化,但是其中,使用真实信息主体去创建数据可视化作品的做法非常了不起。这份来自Austria Solar的年度报告,通过在页面上使用太阳光感墨水,用真正的太阳能给公司数据赋予生命。

一句话总结:他们是天才。

关于数据分析经典案例和数据分析著名案例的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。 数据分析经典案例的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于数据分析著名案例、数据分析经典案例的信息别忘了在本站进行查找喔。

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:wps office怎么拼音声调
下一篇:统计数据分析报告(统计分析报告)
相关文章