当前位置:   金科网 > 大数据 > 正文

大数据分析关键的5个思维

  数据分析在互联网公司的重要性不言而喻,随着社会对数据分析人才需求量的增大,越来越多的人在朝数据分析的方向发展。但很多人谈到数据分析时首先想到的是数据分析工具,如Python、SQL等,却忽略了数据分析思维的培养。

  数据分析思维决定了从哪些方面分析,而数据分析工具主要是服务于数据分析思维。简单地说,数据分析思维决定了分析方向,而数据分析工具只是帮你达到目的地。

  一个连分析的方向都搞不清楚的人,即使通过数据分析给出了一些结论,这些结论也很难让人信服,因为这些一般都是片面的,当然更谈不上对业务的指导。

  本文我就通过一个案例来教大家掌握五个关键的数据分析思维。

  案例:某电商公司最近一个月的GMV环比增长10%,但本月用于销售的成本支出却环比增长50%,分析GMV环比增长率低于销售成本增长率的原因。

  一、因素分解法

  因素分解法,顾名思义,就是分解影响目标的因素。

  案例中,影响GMV的因素可以从多个维度拆分:

  渠道维度:总体GMV=渠道1 GMV+渠道2 GMV+…+渠道n GMV

  城市(子公司)维度:总体GMV=城市1 GMV+城市2 GMV+…+城市n GMV

  GMV=订单量*客单价

  订单量=活跃用户数*下单率

  活跃用户数=新增活跃用户数+活跃的老用户数

  显然,订单量、活跃用户数、新增活跃用户数、活跃的老用户数等每一个因素都可以再分解到渠道和城市维度,而每个城市也可以再分解到渠道维度。这就是交叉因素分析法。

  每一个因素的变化如何分析呢?这就需要用到对比法。

  二、对比法

  对比法主要有环比上期、同比去年同期两个比较基准,当然也可以根据业务情况,确定其他比较基准。

  对比法可以发现数据变化的规律,并且增长率可以定量反映数据变化情况。不同时期的同比增长率可以对比,环比增长率也可以再对比。

  如案例中,若同比去年,发现去年11月GMV的同比增长率为20%,而今年的同比增长率只有5%,显然今年11月份的增长率同比去年11月份变低了。

  提到对比,不得不提到值得注意的一点:趋势固然重要,但不要只看大致趋势,要分析具体的变化比率。数据分析不是告诉别人差不多,而是要告诉别人差多少。

  三、分类法

  在分解了影响目标的因素,并分析了各因素指标的增长率以后,我们可以发现有一些城市、业务单元或者其他对象(如用户)多个关键指标都表现比较好,或者其中一个关键指标表现好,但其他指标表现差。对这些对象我们需要进一步分类,区分出高价值对象、重点发展对象、重要挽留对象和一般维持对象。

  如案例中,我们进一步分析发现:部分用户下单频率很高,客单价也很高;部分用户下单频率比较低,但客单价很高;部分用户下单频率很高,但客单价低;还有部分用户下单频率和客单价都很低。

  四、二八分布法则

  有一个玩笑说:如果一种数据的分布不服从常见的正态分布、泊松分布、二项分布的话,那它就接近服从二八分布了。

  这个玩笑虽然不一定百分之百能概括所有的数据分布类型,但在我们常见的与钱相关的数据分布中,很多都服从二八分布。如:世界上20%的人掌握了80%的财富,一个公司20%的客户贡献了80%的收入,一个公司20%的员工为企业发展贡献了80%的力量……

  二八分布法则对数据分析师的启示是:重点研究贡献80%的收入的20%用户,找出这些用户的特征,再把其他潜在用户培养成这20%的用户,企业就可以越做越大了。所以,作为一名数据分析师,先集中精力把这20%的重要用户研究清楚,再研究其他用户吧。

  通过以上四种思维方法,你已经把案例中下过订单、贡献收入的用户基本分析清楚了。

  但除了下过订单的用户,还有一部分用户是没有下过订单的,这部分用户为什么没有下过订单呢?

  我们需要通过漏斗法来分析用户从登录平台到最后下单的转化率。

  五、漏斗法

  漏斗法主要目的是查看目标事件整个过程中每一步的转化率以及整个事件最终的转化率,发现用户流失最严重的环节,以优化程序和提高整体转化率。如:产品使用过程中每一步的转化率,可以帮助分析产品设计环节的优劣;运营活动每一步的转化率,可以分析运营活动各个环节设计的优劣。

  漏斗法在互联网公司的数据分析中经常被用到,并且经常通过埋点数据分析页面曝光和点击的PV、UV。

  在案例中,电商漏斗可用如下图表示,注册、登录一般是新用户才有的环节,对老用户而言则是启动、浏览商品直至最后支付成功的环节。

  电商用户登录-支付成功漏斗图