在数据分析的学习过程中,我们通常会要求掌握以下两点:
1.理解数据,懂得从数据中发现业务指标(学会如何去看懂数据)
2.使用相关指标去分析数据,同时使用多个指标去分析一个问题(了解常见的指标)
当我们拿到数据(通常以Excel或者数据库方式去呈现数据),那么我们如何去理解数据?
(1) 弄清楚数据每一栏位表示的是什么意思
(2) 对数据进行分类(有助于后期的分析)
通常将数据分为三类:
1.用户数据:用户的基本信息,包括姓名、性别、邮箱、年龄、家庭地址、职业、教育水平等
2.行为数据:记录用户做过什么的数据,其主要包括用户做了哪些行为、发生行为的时间等
例如:逛电商购物平台,用户行为可以是用户在某个产品页面的停留时间、浏览过哪些产品、购买了哪些产品等
3.产品数据:包括产品名称、产品类别、产品评论、库存等
一个平台里的东西都可以看作产品,例如优酷上的视频,CSDN里面的文章,淘宝里面的商品都可以看作产品
例如:把CSDN发过的文章看作产品,这样“产品数据”就包括文章标题、文章阅读量、发布文章的日期等
对于数据的分类并不是绝对的,要根据具体业务去灵活定义
有些数据从不同角度来看,可以属于不同的分类。例如,对于B站视频的收藏量而言,收藏是一个用户的行为,那么收藏量可以看作是行为数据;另外,收藏是产品(视频)被收藏,那么收藏量也可以看作是产品数据
聚焦某一个业务问题或者场景进行数据分析时,首先需要构建合理的指标体系或者模型,从而能够有效“整理”来自不同数据源的各场景所汇聚的大量数据
指标是指将业务单元精分后量化的度量值,能够使得业务目标可描述、可度量、可拆解;另一种说法:用某个统一标准去衡量业务,这个统一的标准就是指标
2.1.1 用户数据指标
① 日新增用户数:产品每天新增的用户是多少
提示Tips:按渠道维度来拆解新增用户,可以看出不同渠道分别新增了多少用户,从而判断出渠道推广的效果
② 活跃用户数按时间可分为日活跃用户数、周活跃用户数以及月活跃用户数
日活跃用户数:一天之内活跃的用户数
周活跃用户数:一周之内至少活跃一次的用户总数
月活跃用户数:一个月之内至少活跃一次的用户总数
提示Tips:统计活跃用户数需要去除重复的数据,例如小明每天都登录CSDN博客网站,每天活跃1次,1个月活跃30次,月活跃人数不是30而是1,不管1个人1个月活跃多少次,月活跃人数是1
③ 活跃率是活跃用户在总用户中的占比,根据时间可分为日活跃率、周活跃率以及月活跃率
④ 留存率:第1天新增的用户中,在第N天还在使用产品的用户数除以第一天新增总用户数,如果按时间划分,留存率可分为次日留存率、第3日留存率、第7日留存率以及第30日留存率
举个栗子,某产品第1天新增用户100个,第2天这100个人里面有40个人还在使用该产品,那么次日留存率 = 40 / 100 = 40% ;如果第7天这100个人里面有20个人还在使用该产品,那么第7日留存率 = 20 / 100 = 20%
次日留存率:第1天新增的用户中,在第2天使用过产品的用户数 / 第1天新增总用户数
第3日留存率:第1天新增的用户中,在第3天使用过产品的用户数 / 第1天新增总用户数
第7日留存率:第1天新增的用户中,在第7天使用过产品的用户数 / 第1天新增总用户数
第30日留存率:第1天新增的用户中,在第30天使用过产品的用户数 / 第1天新增总用户数
提示Tips:留存可以评估产品功能对用户的黏性,反映用户留存的指标,我们可以使用留存率来表示
通过渠道推广过来的新用户,经过一段时间可能会有一部分用户逐渐流水,这类用户被称为流失用户,留下来的用户称为留存用户
2.1.2 行为数据指标
① PV(Page View):访问次数,一定时间内某个页面的浏览次数
某一个网页1天中被打开10次,那么PV就是10,可理解为用户每打开一个网页可以看做一个PV
② UV(Unique Visitor):访问人数,一定时间内访问某个页面的人数
某一个网页1天中被1个人打开过10次,那么UV是1而不是10
提示Tips:通过比较PV或者UV的大小,可以看到用户喜欢产品的哪个功能,不喜欢哪个功能,从而根据用户行为来优化产品
③ 转发率:转发某功能的用户数 / 看到该功能的用户数
④ 转化率:在一个统计周期内,完成转化行为的次数占推广信息总点击次数的比率
提示Tips:转化率的计算方法与具体业务场景有关
举例说明
店铺转化率 = 购买产品的人数 / 到店铺的人数
广告转化率 = 点击广告的人数 / 看到广告的人数
2.1.3 产品数据指标
① GMV(Gross Merchandise Volume):成交总额,包括销售额、取消订单金额、拒收订单金额和退货订单金额
一个电商企业的月销售额为20w元,未支付订单金额2w元,拒收订单金额0.5w元,退货订单1w元,那么该电商的GMV = 20w + 2w + 0.5w + 1w = 23.5w
提示Tips:只要拍下的订单,就会被计入到GMV中,不管取消不取消订单、拒不拒收货物、退不退货
② 成交数量:下单的产品数量
③ 访问时长:用户使用App或者网站的总时长
④ ARPU(Average Revenue Per User):人均付费,也称为客单价
人均付费 = 总收入 / 总用户数
⑤ ARPPU(Average Revenue Per Paying User):付费用户人均付费
付费用户人均付费 = 总收入 / 付费人数
⑥ 人均访问时长:统计每个人使用产品的平均时长
人均访问时长 = 总时长 / 总用户数
⑦ 付费率:反映产品的变现能力和用户质量
付费率 = (付费人数 / 总用户数) x 100%
某App产品有100万注册用户,其中有10万用户有在该App进行过消费,那么该产品的付费率 = (100000 / 1000000) x 100% = 10%
⑧ 复购率:重复购买频率,指一定时间内,消费两次以上的用户数/付费人数,用于反映用户的付费频率
复购率 = 消费两次以上的人数 / 付费人数
⑨ 产品相关:根据具体的业务需求,灵活扩展使用产品相关指标
例如:热销产品Top N、好评产品Top N、差评产品Top N
注意:除了上述介绍的指标以外,还有其他指标并没有进行讲解,我们也可以按行业(制造业、金融、互联网电商等)以及按业务(推广效果等)不同的维度进行指标选取和设定,读者可自行去查阅检索
(1) 原子指标
原子指标 = 行为事件 + 度量
可理解为某一业务行为事件下的度量,是业务定义中不可拆分的指标,如点击量
原子指标还会基于维度、修饰词、统计口径构建出派生指标
(2) 派生指标
派生指标 = 一个原子指标 + 多个修饰词 + 时间周期
例如:
原子指标 = 点击量
派生指标 = 近一周ios注册用户点击量
近一周ios注册用户点击量
时间周期:近一周 修饰词:ios 维度:注册用户 原子指标:点击量
这么多指标,如何选择呢?选择指标的时候,需要考虑两点
1.好的数据指标应该是比例
通常要想理解一个数字的真实含义,最好把它除以一个总数,换算成一个比例。
例如:告诉你公众号打开次日文章用户数(活跃用户数)是1万,让你分析公众号是否有问题。这其实是看不出来的,如果告诉你总粉丝数有10万,那么可以计算出次日活跃率 = 1万(活跃用户数) / 10万(总用户数) = 10%,与行业平均活跃率(公众号的平均活跃率是5%)相比较而言,会发现该公众号活跃率很高
所以,在求职面试或者工作里看到指标的时候,要看这个指标是不是个比例,如果不是,需要换算成比例
2.根据目前的业务重点,找到核心指标
核心指标没有唯一标准。不同的公司关注的业务重点不一样,即使是同一家公司在不同的发展阶段,业务重点也不一样,所以要根据目前的业务重点,去寻找核心指标
注:用户收听时长,就是每一个用户进来以后,他能听多久的音频(喜马拉雅是音频APP)
在统计研究中,如果要说明总体全貌,只使用一个指标往往只能反映总体某一方面的数量特征。此时,就需要同时使用多个相关指标,而这多个相关又相互独立的指标所构成的统一整体,即为指标体系(指标体系是从不同维度梳理业务,把指标有系统的组织起来)
将指标体系化本质是将数据指标系统性的组织起来
简而言之,指标体系 = 指标 + 体系,一个指标不能叫指标体系,几个毫无关系的指标也不能叫指标体系,如果只有指标而没有体系,我们能够获取的信息就会变得很乱(指标体系不是指标的罗列)
建立指标体系的目的在于获取全局性的、有体系的信息,进而通过这些信息去驱动业务的发展,达成组织目标
指标体系的作用
1.监控业务情况
2.通过拆解指标寻找当前业务问题
3.评估业务可改进的地方,找出下一步工作的方向
对于一家公司的业务是否正常(健康),可以通过指标体系对业务进行监控。当业务出现异常时,就能以最快的速度发现问题,开始分析,然后解决这些问题,最大化地减少损失。
缺少数据指标体系规划,容易出现的问题:
1.问题定位难
2.数据采集工作反复进行
3.上下目标不一致
4.监控、分析阶段效率低
分析具体业务问题时,找数据会变得越来越难,每天会消耗大量时间在不断寻找数据、核对指标的泥潭中,因此构建数据指标体系极为重要
好的指标体系是随着实践的深入和认识的提高,逐渐生长出来的,而非起初就完美设计出来
每个指标可以从以下3个方面确定统计口径
① 指标业务含义:这个指标在业务上表示什么?
② 指标定义:这个指标是怎么定义的?
③ 数据来源:从什么地方收集的原始数据?数据统计的时间范围是什么?
1.明确部门KPI,设定一级指标
一级指标是用于衡量公司或部门运营整体目标达成的情况以及战略目标的结果
一级指标并非只能是一个指标,有可能需要多个指标来综合评价
2.了解业务运营情况,设定二级指标
针对一级指标进行分析拆解,高效定位一级指标波动的原因,具体如何拆解,需要了解业务是如何运营的
3.梳理业务流程,设定三级指标
定位二级指标变动的原因,把二级指标按照业务流程拆解为更细的三级指标,指导一线部门的决策
4.通过报表监控指标,不断更新指标体系
通过前面三个步骤找到一级指标、二级指标以及三级指标,使用表格、图表来展示指标,通过报表监控指标,方便业务部门掌握业务情况的同时,也能够实时更新指标体系
制作报表步骤
(1) 需求分析
制作报表的目的是什么?
(2) 建立指标体系
(3) 设计展现形式
如何展示数据,才能让业务部门更容易地理解数据?
(4) 编写需求文档
说明报表原型,更新频率等信息
(5) 报表开发
和开发沟通排期,跟进开发进度,验证报表的数据质量
补充扩展知识:建立指标体系需要注意以下4点
① 抓住问题重点,需要设置准确的一级指标
② 指标之间需要有逻辑关系
如果不按照业务流程来建立指标体系,虽然指标很多,但是指标之间没有逻辑关系,以至于出现问题的时候,找不到对应的业务节点是哪个,没有办法解决实际问题
③ 拆解的指标需要有业务意义,不能只为了拆解而拆解
④ 建立指标体系需要各部门紧密沟通,需要对公司业务和各部门职能有深刻的理解