数据分析中关于指标的理解

第一关键指标指标是衡量当前产品状态的指标,指明当前状态是否符合预期。

好指标的标准

  • 是对比类型的指标
    • 只给出一个指标数字是没有实际意义的,因为你不知道这个2%是好是坏,如果说与前一个月相比增加了2%就有了业务含义。不过,仍然需要注意的是,这个增长了2%也只是现象的描述,如果需要定性是不是好的状态就需要定义一个标准,比如1%是一个水平线,那么2%就表明增长量是好的。
  • 好的指标是简单易懂的。
    • 这个指标不能太过于复杂,复杂就难以解释,就不好得出确定性的结论。一个简单的指标可以容易达成共识,方便判断好坏。比如销售类指标,销售额就是一个很好的KPI,因为足够简单,足够说明问题。
    •  
  • 是一个比率型的指标。
    • 比率型的指标不是狭隘的0-100%,而是说这类指标是A/B的形式得到的指标。一个好的比率型指标应该类似汽车中的速度,速度表征了距离和时间的关系,当你看了速度表结合自己的当前位置就知道自己目前是否需要加速或者减速,平衡到达时间和违章之间的关系。并且比率型指标还可以表现出相除指标之间的相关性(正或者负)。比如一个依靠付费高级功能盈利的免费应用而言,免费版提供的功能数量与付费率之间的关系如下图所示。如何确定最佳免费功能数,就需要一系列的AB测试获得。

和业务相关的指标。

指的是你关注的这个指标可以反映出你此刻业务的情况,基于这个指标的好坏你可以做一些动作。

 

探索性指标与报告性指标。

探索指的是那些我们不知道我们不知道的东西,这部分通常有着很大的价值。相比于报告性指标,我们虽然不知道数量,但是我们可以去获得,而对于探索性的我们根本没有意识他们的存在。四象限法:知道、不知道、知道、不知道,矩阵法可以很好的对指标进行聚类。

 

先见和后见指标

先见性指标是哪些有依赖关系的指标,比如对于位于转化漏斗头部的指标,头部指标越大,后续的指标数量也会越大,这就是先见性指标。对于后见性指标,属于马后炮式的指标,只有事发后才会知道,比如流失率。用户流失了这个指标才有,后见性指标虽然无法挽回了,但是可以通过分析引发的原因,在之后进行规避,以后减少类似的流失。

 

相关性和因果性。

相关不代表因果。这一点很容易被混淆。啤酒的销量和温度有关,销量越大气温也越高,但是我们不能说控制了啤酒的销量,气温就降低了,温度高了是因为夏天到了。相关性可以用来预测未来,因果可以改变未来。如何确定因果性呢,通过控制对照组实验的方式,通过改变相关变量最后得到变化的原因,找到因果。

 

市场细分。

就是一群拥有某种共同特征的人。这个特征可以是使用同一个浏览器、和一样的啤酒品牌、家里有相同数量的孩子等。不过需要注意的是,这些人不必所有方面都一样,只需要某方面一样就可以。没有两个人是完全一样的,所以一群人都一样是不可能的。

 

同期群分析。

产品是迭代上线的,不同版本或者不同渠道、不同时间的用户对产品的反应是不一样的,对于平均用户收益来讲,如果只是按照时间段统计,那么这个指标就反应不出来什么问题,因为你不知道这个指标好坏是哪个群体导致的,所以就需要把用户进行分群,同期群就是按照时间维度相同时间段内的用户就为一个群,这样再统计就可以把聚合的指标分解出来,那个群体有问题一目了然。本质上这就是分组分析,按照人群group by了一下,再把时间维度加上得出的。

 

常见的网页虚荣指标:

1、点击量(某个链接、按钮等点击的次数)

2、浏览量PV(页面的浏览次数,可累加)

3、访问量(去重后的浏览量)

4、平均访问次数(PV/访问量)

5、独立访客数(通过cookie等方式标识的独立用户数)

6、跳出率(跳出是指用户访问一个网页就关闭的行为,跳出的总数量/总访问次数)

7、平均页面停留时间(页面总停留时间/浏览量pv)