听见涛声_数说张小桃

日拱一卒 | 梳理、沉淀、数据科学家踩坑之路 | 努力成为数据分析领域python最强的人

导航

2022年4月11日 #

python 速查表-Pandas数据分析常用函数

摘要: 阅读全文

posted @ 2022-04-11 13:31 数说张小桃 阅读(60) 评论(0) 推荐(0) 编辑

python速查表 - Scikit-Learn

摘要: 阅读全文

posted @ 2022-04-11 12:10 数说张小桃 阅读(62) 评论(0) 推荐(0) 编辑

python 速查表-Pandas进阶

摘要: 阅读全文

posted @ 2022-04-11 11:22 数说张小桃 阅读(28) 评论(0) 推荐(0) 编辑

python 速查表-Pandas基础

摘要: 阅读全文

posted @ 2022-04-11 10:28 数说张小桃 阅读(28) 评论(0) 推荐(0) 编辑

python速查表-Seaborn

摘要: 阅读全文

posted @ 2022-04-11 09:46 数说张小桃 阅读(34) 评论(0) 推荐(0) 编辑

2022年4月6日 #

待完 |留存分析思路

摘要: 【参考】 【1】留存分析3500字干货,方法+案例+参考代码 阅读全文

posted @ 2022-04-06 18:50 数说张小桃 阅读(39) 评论(0) 推荐(0) 编辑

2022年4月4日 #

笔试题 |2020 PDD分析师

摘要: 一、活动运营数据分析 表1:订单表 orders,大概字段有(user_id‘用户编号’, order_pay‘订单金额’ , order_time‘下单时间’) 表2:活动报名表act_apply,大概字段有(act_id‘活动编号’, user_id‘报名用户’,act_time‘报名时间’) 阅读全文

posted @ 2022-04-04 19:39 数说张小桃 阅读(96) 评论(0) 推荐(0) 编辑

2022年4月3日 #

待完成 |CX Index 用户体验分析模型

摘要: 待完成 |CX Index 用户体验分析模型 阅读全文

posted @ 2022-04-03 11:29 数说张小桃 阅读(22) 评论(0) 推荐(0) 编辑

2022年4月1日 #

Excel 常用五类函数汇总

摘要: 工欲善其事,必先利其器 不因为你会Python而成为数据分析师,而是能用任何工具解决问题,Excel因为其简单易用,而受到人们的青睐。 本节整理了常用的EXCEL函数,包含文本清洗类、关联匹配类、逻辑运算类、计算统计类、时间序列类五类,针对不同的函数,进行归类和汇总。 一、文本清洗类 Len 统计文 阅读全文

posted @ 2022-04-01 13:01 数说张小桃 阅读(518) 评论(0) 推荐(0) 编辑

Excel 行列转换

摘要: offset函数 功能: 以指定的(单元格或相连单元格区域的引用)为参照系,通过给定偏移量得到新的引用。返回的引用可以是一个单元格也可以是一个区域(可以指定行列数,即数组)。 语法: =offset( reference, rows, cols, [height], [width]) =offset 阅读全文

posted @ 2022-04-01 12:45 数说张小桃 阅读(423) 评论(0) 推荐(0) 编辑

if({1,0} , ...)用法

摘要: 一、if函数 判断是否满足条件,满足True 则返回第2个参数,不满足False 则返回第3个参数。 使用格式:=if(条件判断 ,返回值1 ,返回值2) 二、if({1,0} , ...)用法 参数为数组时,会分别进行计算。在if({1,0} , ...)中,根据参数数组两个条件(1表示True, 阅读全文

posted @ 2022-04-01 00:00 数说张小桃 阅读(1359) 评论(0) 推荐(0) 编辑

2022年3月31日 #

Vlookup 查找和多条件查找

摘要: 一、vlookup单条件查找 使用格式:=vlookup(查找值,查找范围,返回列,是否精准匹配) =VLOOKUP(E2,$B$2:$C$6,2,0) 二、vlookup多条件查找 应用场景1:简单的多条件查找——同时通过"姓名和地市",匹配"下单量" =VLOOKUP(F2&G2,IF({1,0 阅读全文

posted @ 2022-03-31 22:37 数说张小桃 阅读(614) 评论(0) 推荐(0) 编辑

AARRR 用户增长模型

摘要: 一、基础理论 产品经理 《增长黑客》数据分析基础 -- 获取(Acquisition)-- 激活(Activation)-- 留存(Retention)-- 收入(Revenue)-- 传播(Referral) 1.获取用户 运营、移动应用、获取用户、推广渠道下载量 → 安装量 → 激活量移动应用运 阅读全文

posted @ 2022-03-31 19:49 数说张小桃 阅读(191) 评论(0) 推荐(0) 编辑

无业务,不分析

摘要: 数据分析的归宿是要解决某个具体的问题。 因此,最终在分析师支持下能出一套可落地的解决方案才能体现价值,经过3~5年达到高级以上,就要特别注意不能还是成为一个提数工具了。随着BI和中台技术发展,这些现在还需要手工处理的过程必然会被机器自动化取代。要充分发挥人的主观能动性,在深度和广度上下功夫。 懂业务 阅读全文

posted @ 2022-03-31 12:47 数说张小桃 阅读(72) 评论(0) 推荐(0) 编辑

转载 |工作中我常用的分析算法

摘要: 【参考】 【1】工作中我常用的分析算法 阅读全文

posted @ 2022-03-31 12:22 数说张小桃 阅读(35) 评论(0) 推荐(0) 编辑

2022年3月30日 #

回归模型中的哑变量是个啥?何时需要设置哑变量?

摘要: 【参考】 1、回归模型中的哑变量是个啥?何时需要设置哑变量? 阅读全文

posted @ 2022-03-30 13:10 数说张小桃 阅读(215) 评论(0) 推荐(0) 编辑

区别 | Flink 对 Spark Stream、Kafka Stream、Storm比较优势,以及阿里巴巴基于Flink打造的Blink解决的问题...

摘要: 一、Spark Stream、Kafka Stream、Storm等存在的问题 Spark Streaming的本质还是一个基于microbatch计算的引擎。这种引擎一个天生的缺点就是每个microbatch的调度开销比较大,当我们要求的延迟越低,额外的开销就越大。这就导致了Spark 实际上不是 阅读全文

posted @ 2022-03-30 11:38 数说张小桃 阅读(665) 评论(0) 推荐(0) 编辑

2022年2月25日 #

备用

摘要: test 阅读全文

posted @ 2022-02-25 16:16 数说张小桃 阅读(21) 评论(0) 推荐(0) 编辑

2022年1月6日 #

IV(信息价值)和WOE分箱(证据权重)

摘要: IV(信息价值)和WOE分箱(证据权重) 【参考】 【1】知乎 风控模型—WOE与IV指标的深入理解应用 阅读全文

posted @ 2022-01-06 12:37 数说张小桃 阅读(74) 评论(0) 推荐(0) 编辑

t检验三种类型

摘要: 区别: 假设检验通常是检验样本对应的总体之间是否有显著性差异 而关联性检验是检验是否显著相关。 一、单样本t检验 1、设计思想: 两个总体,总体A已知;总体B未知,但其样本已知,问题是未知总体B与已知总体A之间有无差异?实际上是验证该样本是否就是来自这个已知总体A? 2、适用: (1)已知一个总体和 阅读全文

posted @ 2022-01-06 12:01 数说张小桃 阅读(3533) 评论(0) 推荐(0) 编辑