大数据的四大特点(4V)
大数据的四大特征(4V)
1、是数据体量浩大(Volume)。截至目前,人类生产的所有印刷素材的数据量是200PB(1PB=210TB),而历史上全人类说过的所有的话的数据量大约是5EB(1EB=210PB)。当前,典型个人计算机硬盘的容量为TB量级,而一些大企业的数据量已经接近EB量级。
2、是数据类型繁多(Variety)。这种类型的多样性也让数据被分为结构化数据和非结构化数据。相对于以往便于存储的以文本为主的结构化数据,非结构化数据越来越多,包括网络日志、音频、视频、图片、地理位置信息等,这些多类型的数据对数据的处理能力提出了更高要求。
3、是价值密度低(Value)。价值密度的高低与数据总量的大小成反比。以视频为例,一部1小时的视频,在连续不间断的监控中,有用数据可能仅有一二秒。如何通过强大的机器算法更迅速地完成数据的价值“提纯”成为目前大数据背景下亟待解决的难题。
4、是处理速度快(Velocity)。这是大数据区分于传统数据挖掘的最显著特征。依据IDC的“数字宇宙”的报告,估量到2020年,全球数据使用量将达到35.2ZB。在如此海量的数据面前,处理数据的效率就是企业的生命。
在电商运营中,你觉得数据分析有多重要呢?为什么
很多第一次做电商运营的人都不知道要怎么做分析,我之前也做过互联网运营,一开始无非就是看看PV、UV,分许分析流量就完事了,但是很快老板就会发现我的分析结果根本没有任何价值,因为分析这些东西根本毛用都没有!
但是我也很无奈,因为这些常规数据就绑定着我的KPI,要是不做的话,我就会被扣钱扣工资,运营分析还能怎么搞出花来?老板是为了公司盈利,我也要为了生活啊。
后来我才知道,不是分析方法和内容不对,而是没有关注到重点的数据。
顿悟的方法很简单,往问一个专业的搞数据分析的就行了,我有幸就碰到了这么一位,简直称得上是扫地僧一样的隐躲人物,几句点拨就足够我学习的了。
一、首先,要明白自己企业的商业模式既然题主问的是电商,那么就先说一下电商的盈利模式,很简单:
客户看中了你的产品或者服务,你把产品和服务卖给客户,一个订单完成!
电商公司和o2o类公司都是这种模式,公司的收进是由一个个订单堆积出来,订单是由用户购买了相关的商品或服务产生,可以说用户和商品或服务为订单的两大基本元素,公司收进下降、增长、反常最终都可以追踪到用户与商品这两大元素上。这样我们将公司收进相关数据拆解为三大模块:用户、商品或服务、订单。作为运营人,我们最主要要关注的就是两个字——用户。
公司收进、订单都是由用户消费所产生,用户的消费流程可以划分为以下四个阶段:引流、转化、消费、存留。
当然我们期看最理想的情状就是吸引和转化最多的用户、让他们买我们的产品,并且留住他们好让他们一直买。然而现实是残暴的,我们能做的,就是对这些数据进行分析,依据数据情状进行策略对调整,让现实与理想情状之间的距离越来越近。
我们一般将用户分为新用户和老用户,如下图所示:
无论新老用户,我们都会关怀两块内容,一个是引流(拉新),一个是转化,最终以数据的形式体现出来,就是流量与转化率。
二、引流一个购物中心,建在荒郊野外,没人进来,装饰再奢华也没什么卵用。用户是有限的,我们需要精打细算,实现对每种渠道每种类型的流量来源的最大价值利用。
分析目的:通过对流量的分析,保证流量的稳定性,并通过调整,尝试提高流量。
分析内容:基本数据指标有访客数(uv)、浏览量(pv)、访问次数(visits),是常用的衡量流量多少的数据指标;平均访问深度(浏览量/访问次数)、平均停留时间(总停留时间/总浏览量)、跳失率(跳出次数/访问次数)是用来衡量流量质量优劣的指标。
分析角度:
1. 看察流量法则,便于活动安顿、服务调整
上面这个图使用FineReport做的UV分析,可以发现以下法则:一天当中,访问集中在9点到11点和14点到17点这段工作时间,一年中则在春节前后的访问量比较大,每周中也是访问集中在工作日。
一般来说,流量都是以天天中的时段、季节、节假日、星期这样的法则来分布的。所以可以将以上几面统一放到同一页面中进行看测,可以全面的了解使用的访问法则。并且通过对渠道、业务的抉择,可以看测具体的渠道、业务的访问法则。
2.发现流量反常,分析反常原因并及时调整
通过对上图的看察,可以发现反常现象:
3月21日到4月17日到流量图中,工作日到流量一般都保护在2400左右,而看察4月18日到5月15日到图,发现流量从4月19日下滑开始,很少突破2000,也就是流量在近一个月有明显下滑。原因可能是对手购买了竞价排名、自己的seo做的不好等等。
一般来说,流量以周为单位,周期性分布的情状是比较多的,将视角拉长,一次性多看几个周的数据,便于发现问题。将一段时间内的数据与历史数据进行对比,也有助于问题的发现。
除上图中对流量反常的简单监控外,可以对流量进行进一步分解,如下图所示,通过图表联动,看察具体渠道或者业务的流量情状,从而完成对问题的追踪定位,例如通过进一步分析发现,4月中旬开始的流量下降主要出现在pc端,那么可以进一步缩小问题的领域。
3. 看察流量结构,分析其合理性,并作出调整
流量结构一般可分为渠道结构、业务结构、地区结构。通过查询一段时间内的各结构占比,了解流量组成。
如上图所示,在渠道中,pc占比相对过大,而app占比不高,app对于用户具有更大的黏度,所以应分析app占比过低原因,并想方法提高app流量占比。下面的折线图可以对各渠道的流量情状进行追踪,分析占比不合理是短期内出现的,还是长期存在的、辅助问题的分析。
4. 追踪流量情状,衡量活动或者调整效果
对流量的追踪,一般就是对流量的监控,看察活动前、活动中、活动后的转变情状,评估活动效果。一般来讲,活动期间流量会大幅提升,活动后有一定回落,是一个成功的活动。假如活动期间流量上升幅度不大,或者活动结束后流量大幅度跌落,甚至流量低于活动前的正常流量很多,都不能说是一个成功的活动。
三、转化在完成引流的工作后,下一步需要考虑的就是转化了,一个崭新的用户一路走来到完成交易,中间需要经历:
浏览页面(下载app)->注册成为用户->登陆->添加购物车->下单->付款->完成交易
每一环节中都会有用户流失,提高各个环节的转化率,一直是互联网公司运营的最核心的工作。转化率的提升,意味着更低的成本,更高的利润。
分析目的:了解各环节转化情状,分析其反常或不合理情状,进行调整,以提升各环节的转化率。
分析角度:关于转化率的各种名词也特殊多,有静默转化率、登陆转化率、咨询转化率、付款转化率等等,然而并不需要考虑这些词,只要关注用户从接触使用到成交中的几个环节就好。
我们依然使用FineReport中图表的形式来从各个角度对转化数据进行展示分析。
1.看察各环节转化率,分析其合理性,针对转化率反常环节进行调整
上图所示,传统漏斗图只能展示一条路径的转化率情状,稍加修改后,可实现对比功能,例如上图所示的新老用户的转化率的对比。可以依据实际情状中在该图中加进更多环节,例如注册、收躲、开工、竣工等。
从上图中,我们可以发现这样一个问题,下单到付款中的转化率过低,正常来说,用户只要下单,付款的比例是比较大的。对于这个反常,我们来做下推测:
- 又看了下其他家的商品或服务,发现了更好的,就取缔了付款;
- 付款前习惯性的问下相关的人进行确认,然后发现计划有变,所以取缔付款;
- 到了付款的时候发现居然不支持支付宝,无奈取缔付款;
- 下单后被告知没货;
- 页面好卡,怒而弃之;
- 余额不足
总体上可以分为两类:用户本身原因,系统设计原因。上图中这么出现付款率这么低的情状,基本上可以确定是系统原因。然而具体是哪块的设计出了问题,可以进一步细化追踪。
如上图所示,点击相应阶段,联动出下面各渠道与各业务的转化率明细,可以看出,各渠道的转化率区别较大,其中pc端转化率明显偏低,而各业务之间的转化率区别不大,基本可以确定,是pc端存在问题,导致转化率偏低。
上图中的付款转化率低的太明显,只要不瞎都能看出这转化率出了问题,但是往往转化率的问题并没有这样的明显,那怎样定位自己的转化率是否合理,哪个阶段的转化率有提升空间呢?陆续看下面这张图:
上图是通过多角度对比来分析业务转化率的健康状况,包括与自己同期对比、行业中与自己相似产品对比、行业中优异的产品对比。对比各环节转化率的不同,产生数据上的冲击,所有落后的节点,都是可以提升的空间。
2. 追踪转化率转变,用于反常定位和策略调整效果验证
除流量外,转化率也是需要追踪的,将时间的维度拉开,分析各阶段转化率随着时间的波动,也是很有看点的。
如上图所示,在4月17日到21日中间,转化率出现下滑趋势,通过渠道转化率与业务转化率两个图表的联动,可以追踪定位导致转化率下滑的渠道或业务。常见的原因,公司运营部门投进了某个渠道进行妥善,新的渠道带来了新的流量,而该渠道所引进的用户质量却偏低,拉低了整体的转化率。
3. 看察各渠道转化情状,定义渠道价值,并依此适当调整运营策略
气泡图在传统图表中信息量涵盖相对是比较大的,上面这张图x轴和y轴分别表达流量和转化率,y轴可以依据分析内容不同切换成点击率、注册率、架构率、下单率等等,气泡大小表达的为渠道ROI。从上图中可以看出,在右上象限中的渠道价值是比较大的,再综合考虑ROI,还可以看出渠道性价比情状。
4. 分析各环节转化周期,分析用户习惯,为制定运营策略提供依据
这种场景通用性并不是很强,会和公司业务相关联,有些业务的交易是分成多个阶段来完成,这种情状可以对转化周期进行分析。
上图中可以看出,该业务的付款与成交一般在前四面完成,而第五周开始趋于稳定。知道以上信息后,可针对第五周未付款或完成交易的用户进行询问,提高转化率。另外可制定四面内完成交易有奖励等活动来缩短成交周期,因为图中可以看出,绝大部分用户四面时间足够完成服务检查、订单确认等工作。
四、日活/存留互联网行业的拉新成本现在都很高,要投进广告、投进时间,这些都是成本。假如用户还没有产生什么价值就流失了,那一定是亏了。相反,拉过来的用户,存留的时间越长,产生的价值也就越大,也才能弥补其他流失用户所产生的缺失。因此,提高用户的存留时间,也是提高公司收进,为公司发明更多价值的重要一环。
分析目的:通过分析用户的日活/存留,来扶助运营人员发现问题、监控数据,为调整策略提供数据支持,达到提高日活/存留的效果。
分析角度:
1.日活监控,看察用户活跃数据,分析日活健康度
活跃用户一般可以分为以下三类:
有些公司可能不太关注回流(一定时间内没有登陆的用户再次登陆)这部分用户,我将它列出来,是认为了解回流用户的日活情状在一些场合中是有价值的,例如活动期间、发优惠券测试,是否会对流失用户的回流产生了作用。
上图中是用finereport做的堆积面积图,其面积大小为各类型用户数,堆积总高度为总活跃用户数。对于日活数据来说,相对理想的情状是老用户占比较高,为活跃用户主力,并且显现逐步上升的趋势,代表产品对新用户的粘性较好,总体拉新存留大于流失用户。否则,要么是新用户的存留率过低,要么是老用户的流失率过高,都需要进行调整。
2.看察存留法则,定位存留阶段,辅助市场活动、市场策略定位等
存留法则分析应该分开对待,一部分高频小额订单(例如外卖)这种互联网公司,其分析模式类似于游戏、知乎、SasS平台,会以日为单位来分析存留。
如上图所示,这种用户登录频率较高的使用,可以通过上图分成三个阶段,过滤期、试探期、平稳期。刚开始接触一个使用的用户中,有大量的用户是质量不高的用户,不可避免的要经历一个存留率大幅下降的阶段,但这一阶段周期一般较短(我认为这一阶段可能更多的是使用筛选用户)。在这一阶段过往之后,用户会对使用进行详尽的试探,是否让自己称心,这段期间也会有部分用户流失。最后留下的就是相对稳定的用户了。
上图可称之为手枪图,该图可以看出用户存留的整体情状,存留率有没有越来越高,产品粘性是否做的够好,通过上图可以看出一定的问题来。但要像日存留那样,找出用户存留的三个阶段是比较困难的,因为用户是否存留下来更多的取决于消费体验,并且消费体验周期过长,很难推断用户是否会再次消费。
3.对比不同用户、产品功能的存留情状,分析产品价值、辅助产品调整
如上图所示,通过对比,发现使用了分享功能和收躲功能的用户的存留率相对较高。得到这样一个信息后,可以通过产品上的调整,来鼓励用户使用分享、收躲等功能,以此来提高用户的存留率。
这种对比可以是多种形式的,将功能抉择换成用户分类、用户来源,可以从不同的角度来看察问题。例如,假如发现男性用户的存留率比女性用户低,那么一是可以提醒反思造成这种情状的原因是什么,或者是可以调整产品妥善渠道,以吸引女用户主。
存留率是互联网公司非常关注的指标之一,而很多公司会对存留率进行非常深进的挖掘。上文提供几种存留率常用的展现形式,为分析存留率提供一定的参考。