随笔分类 -  Data Analysis

摘要:什么是异常值? 对于定性变量来说,异常值是出现次数非常少的类别;对于定量变量来说,异常值是明显大于或小于其他观测值的数值。 异常值产生的原因: a. 人为错误:在数据收集,记录或输入过程中导致的错误。 b. 测量误差: 当使用的测量仪器出现故障时,会引起这种情况,这是异常值最常见的来源。 c. 实验 阅读全文
posted @ 2021-01-06 15:35 HuZihu 阅读(4585) 评论(0) 推荐(0) 编辑
摘要:说了那么多假设检验的理论,现在来让我们上手操作一下。 这里我自己编造了一个A/B测试的例子: 某公司原来的购买转化率是30%,现在想通过把其网页上的”购买“按钮加大一倍,使购买转化率提升到33%。 可以看到这里的对比指标是转化率,因此这里适用两独立样本比率检验。 原假设:对照组的购买转化率与试验组的 阅读全文
posted @ 2019-12-29 12:32 HuZihu 阅读(2863) 评论(0) 推荐(0) 编辑
摘要:数据分析师主要处理的几种工作内容: 1,临时性需求(专题分析):比如说监控到现有的指标出现了异常情况,需要通过数据分析去找原因 2,制作日常报表:日报,周报,月报,数据仪表板,等等 3,数据挖掘:比如通过做用户分析(行为、设备、渠道、心理等等各种分析,例如:用户路径分析和转化漏斗分析),做“用户分层 阅读全文
posted @ 2019-12-27 21:18 HuZihu 阅读(7643) 评论(0) 推荐(0) 编辑
摘要:AARRR模型是“增长黑客”中驱动用户增长的核心模型。模型的提出者认为,所有成长型的企业都应该按照这个模型来做增长。 AARRR:从获取用户(Acquisition)、提高活跃度(Activition)、提高留存率(Retention)、获取营收(Revenue)和自传播(Referral)这5个阶 阅读全文
posted @ 2019-12-27 15:34 HuZihu 阅读(1388) 评论(0) 推荐(0) 编辑
摘要:什么是A/B测试? A/B 测试是一种产品优化的方法,为同一个优化目标制定两个方案(比如两个页面),让一部分用户使用A 方案(称为控制组或对照组),同时另一部分用户使用 B 方案(称为变化组或试验组),统计并对比不同方案的转化率、点击量、留存率等指标,以判断不同方案的优劣并进行决策。 A/B测试的本 阅读全文
posted @ 2019-12-26 21:41 HuZihu 阅读(4744) 评论(0) 推荐(0) 编辑
摘要:数据分析方法论 营销方面:4P,用户使用行为,STP理论,SWOT,等等 管理方面:PEST,5W2H,生命周期,逻辑树,金字塔模型,SMART原则,等等 4P理论 从产品(Product)、价格(Price)、渠道(Place)和促销(Promote)这四个方面分析市场。适用于公司整体经营状况的分 阅读全文
posted @ 2019-12-23 21:39 HuZihu 阅读(2494) 评论(0) 推荐(0) 编辑
摘要:在理解什么是埋点之前,首先需要了解一些基础知识:(以下摘自:http://www.chinawebanalytics.cn/auto-event-tracking-good-bad-ugly/) 我们能够监测网站上用户的行为,或者app上用户的行为,都需要在网站的每一页或者app中加上一些程序代码( 阅读全文
posted @ 2019-12-23 17:52 HuZihu 阅读(18535) 评论(0) 推荐(2) 编辑
摘要:什么是用户行为路径? 用户行为路径即抽象用户在网站或APP中的访问路径。其可用桑基图展现,称为用户路径图。 什么是用户行为路径分析? 用户路径分析追踪用户从某个开始事件直到结束事件的行为路径,即对用户流向进行监测。 用户行为路径分析有什么用? 用户路径分析可以用来衡量网站优化的效果或营销推广的效果, 阅读全文
posted @ 2019-09-05 14:24 HuZihu 阅读(7418) 评论(3) 推荐(2) 编辑
摘要:什么是用户生命周期? 用户生命周期是从用户开始接触产品到离开产品的整个过程。用户生命周期可分为:引入期、成长期、成熟期、休眠期、流失期。对应的是用户对产品不同的参与程度。 用户生命周期有什么用? 按照用户生命周期来划分用户,能够帮助我们了解处于不同生命周期用户的需求,开展运营策略,从而减少用户流失。 阅读全文
posted @ 2019-09-04 21:06 HuZihu 阅读(13513) 评论(0) 推荐(0) 编辑
摘要:什么是用户画像? 用户画像是根据某个具体的用户的人口学特征、网络浏览内容、网络社交活动和消费行为等信息而抽象出的一个标签化的用户模型。例如某用户的画像是:男,31岁,已婚,收入1万以上,爱美食,团购达人,喜欢红酒配香烟。 用户画像的本质: 将用户信息标签化(包括该标签的权重),如:喜欢红酒 0.8、 阅读全文
posted @ 2019-09-04 15:37 HuZihu 阅读(2098) 评论(0) 推荐(0) 编辑
摘要:二八法则的定义:在任何一组事物中,最重要的只占其中一小部分,约20%,其余80%尽管占多数,却是次要的。 二八法则的例子:社会上20%的人占有80%的社会财富 20%的工厂有80%的产出 80%的利润来自于20%的产品 20%的消费者贡献80%的利润 二八法则的应用:比如“20%的消费者贡献80%的 阅读全文
posted @ 2019-09-04 14:06 HuZihu 阅读(2031) 评论(0) 推荐(0) 编辑
摘要:用户分层和用户分群都是将用户分成不同的类别,以此来区别对待不同的用户。 用户分层, 是基于大方向的划分, 而用户分群, 则是将这些层次切分成更细的粒度。 用户分层和用户分群示例: 用户分层的方法,简单的用二八法则分层,常见的有金字塔模型、四象限法、用户生命周期、AARRR模型等。其实用户分层并没有固 阅读全文
posted @ 2019-09-04 13:55 HuZihu 阅读(3097) 评论(0) 推荐(0) 编辑
摘要:什么是用户价值? 用户价值就是对公司来说有用的地方,比如有的公司看中用户的消费能力,有的公司则看中用户的忠诚度 。各公司的业务目的不同,用户价值的体现自然也不同。这里主要说一下适用于电商的RFM模型。 什么是RFM模型? RFM模型根据用户最近一次消费时间R,消费频率F,消费金额M,计算出RFM值, 阅读全文
posted @ 2019-09-03 20:25 HuZihu 阅读(3187) 评论(0) 推荐(0) 编辑
摘要:什么是产品生命周期? 产品生命周期是新产品从开发进入市场到被市场淘汰的整个过程。产品生命周期可分为初创期、成长期、成熟期、衰退期。 产品生命周期有什么用? 在产品不同的生命阶段,公司的业务目的都不同。因此,了解产品的生命周期有助于区分不同阶段的指标并进行针对性分析。 (1)初创期 初创期的重点在于验 阅读全文
posted @ 2019-09-03 15:48 HuZihu 阅读(2817) 评论(0) 推荐(0) 编辑
摘要:什么是金字塔原理?简单来说,金字塔原理就是“中心论点 分论点 支撑论据”这样的一个结构。 图片摘自:http://www.woshipm.com/pmd/306704.html 人类通常习惯于线性思考和表达,这种方式通常会导致逻辑混乱,讲了很久别人也不知道你想表达什么。因此,用金字塔原理进行思考和表 阅读全文
posted @ 2019-09-02 16:19 HuZihu 阅读(2269) 评论(0) 推荐(0) 编辑
摘要:什么是漏斗分析? 简单来讲,就是抽象出某个流程,观察流程中每一步的转化与流失。 漏斗的三个要素: 时间:特指漏斗的转化周期,即为完成每一层漏斗所需时间的集合 节点:每一层漏斗,就是一个节点 流量:就是人群 对于时间来说:通常来讲,一个漏斗的转化周期越短越好。 对于节点来说:最核心的指标就是转化率,计 阅读全文
posted @ 2019-09-02 13:58 HuZihu 阅读(9143) 评论(0) 推荐(0) 编辑
摘要:什么是同期群? 将相同时间段内具有共同行为特征的用户划分为同一个群体,其被称为同期群。“共同行为特征”是指在某个时间段内的行为相似。最常见的是按不同时间的新增用户来划分,然后分析留存率。当然也可以按其他行为来划分用户,譬如“在2017年6月第一次购买”,“在2017年10月第二周对产品的使用频率开始 阅读全文
posted @ 2019-09-01 20:25 HuZihu 阅读(4587) 评论(0) 推荐(1) 编辑
摘要:什么是市场细分? 市场细分其实就是把拥有共同特征的人分在一起。这些共同特征可以是:喜欢喝某个牌子的红酒,飞机总是做头等舱,习惯用windows系统等等。 市场细分有什么用? 1,不同细分市场的需求存在着明显的差别,可以选定某一群体作为目标群体 ,也可以对不同的群体进行精细化运营。 2,可以通过比较各 阅读全文
posted @ 2019-09-01 20:08 HuZihu 阅读(1738) 评论(0) 推荐(0) 编辑
摘要:在《用pandas进行数据清洗(一)(Data Analysis Pandas Data Munging/Wrangling)》中,我们介绍了数据清洗经常用到的一些pandas命令。 接下来看看这份数据的具体清洗步骤: Transaction_ID Transaction_Date Product_ 阅读全文
posted @ 2019-08-25 15:20 HuZihu 阅读(717) 评论(0) 推荐(0) 编辑
摘要:探索性数据分析(Exploratory Data Analysis,EDA)主要的工作是:对数据进行清洗,对数据进行描述(描述统计量,图表),查看数据的分布,比较数据之间的关系,培养对数据的直觉,对数据进行总结等。 探索性数据分析(EDA)与传统统计分析(Classical Analysis)的区别 阅读全文
posted @ 2019-08-24 14:01 HuZihu 阅读(29846) 评论(1) 推荐(3) 编辑

点击右上角即可分享
微信分享提示