TGI指数

一、TGI的概念

TGI分析是数据分析中经常用到的一种方法,先来看一下百度百科中TGI的概念:

TGI:即Target Group Index(目标群体指数),可反映目标群体在特定研究范围(如地理区域、人口统计领域、媒体受众、产品消费者)内的强势或弱势。其计算公式为:TGI指数= [目标群体中具有某一特征的群体所占比例/总体中具有相同特征的群体所占比例]*标准数100。

这段话看起来可能比较绕,我们举个简单的例子,比如知乎全体用户中关注篮球话题用户占比为20%,男性用户中关注篮球的占比为50%,那么篮球话题在男性用户中的TGI为=50%/20%=250%,说明篮球话题在男性用户中表现更为强势,即更受欢迎。

从上面的例子可以看出,TGI可以帮助我们分析特征在目标群体中相对全体用户的表现情况,如果对TGI进行分区的话,主要可以分为三段区间:

TGI=100%:特征在目标群体和全体用户中的表现没有差异

TGI>100%:特征在目标群体中表现更为强势,数字越大越强

TGI<100%:特征在目标群体中表现较为弱势,数字越小越弱

二、为什么要用TGI?

在这里我们举一个简单的例子,假如现在要分析年龄特征对用户流失的影响,发现流失用户中年龄结构如下:

可以看到流失用户中25岁以上的用户占比很高,达到了68%,那我们可以下结论说25岁以上的用户更容易流失了吗?答案是否定的,我们还需要观察全体用户中年龄段的分布情况,有可能全体用户中本身25岁以上用户的占比就比较高。

通过观察整体用户年龄结构可以发现,整体用户中25岁以上用户的占比达到了79%,其实还要高于流失用户,分别计算不同年龄段的TGI,结果如下表格所示。18-25岁年龄段的TGI为150%,说明18-25岁这个特征在流失用户中表现更为强势,即18-25岁的用户可能更容易流失;而我们之前观察到的高占比的25岁以上的用户TGI为86%,反而相对更不容易流失,通过这个case,相信大家基本明白TGI的作用了。

除此之外,大家可能还注意到了0-18岁的用户TGI高达200%,这能说明0-18岁的用户就更容易流失吗,答案是未必的。0-18岁的用户在流失用户中占比2%,整体用户中1%,从绝对值上看,只相差了一个百分点,在占比较小的情况下,很有可能会因为数据上的波动导致TGI失真,这样就没什么价值了。所以在做TGI

posted @   Microtiger  阅读(825)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源!
· 周边上新:园子的第一款马克杯温暖上架
点击右上角即可分享
微信分享提示