08 2021 档案
摘要:Definition Retention is generally depicted by plotting the percentage of users who return to either the product or a core feature over time. Flattenin
阅读全文
摘要:总集: Data-Informed Product Building. An introduction from Sequoia's Data… | by Sequoia | Sequoia Capital Publication | Medium Intro: 随着科技发展, 创造一个产品变得越来
阅读全文
摘要:特征初步分析 特征自身质量(完整度) 特征与目标值的相关性 特征处理 特征清洗 过滤 异常点检测 特征预处理 缺失值填充 归一化 离散化 平滑 降维 哑编码 案例 工程角度: 数据->特征 上面罗列的方法更多是从工程角度来看 业务角度: 知识->因子->特征 第一步, 找专家访谈, 深挖影响要素,
阅读全文
摘要:source: 实战:如何设立数据指标体系? | 人人都是产品经理 (woshipm.com) 1 明确业务类型和核心指标 工具类: 使用频次 交易类: GMV 媒体类: 观看时长 社交类: 互动量 2 拆解核心指标 将核心指标拆解到可执行的程度. 两种拆解思路 (1) 和. 例如: DAU≈新增用
阅读全文
摘要:LIKE 为了在搜索子句中使用通配符,必须使用LIKE操作符 ⚠️通配符搜索只能用于文本字段(字符串),对于非文本数据类型不能使用通配符搜索。 通配符出现在中间: SELECT prod_name FROM Products WHERE prod_name LIKE 'F%y' -- 找出F开头y结
阅读全文
摘要:关联, 介入, 反事实 机器学习做的大部分都是关于"关联", 即两个变量之间有相关性, 却不能给出一者对另外一者是否有影响, 以及影响程度是多大 而介入就会探讨变量之间的因果关系 因为在实践中往往不存在真正的随机试验, 所以需要实验组和对照组 利用 实验组的前后对比 - 对照组的前后对比 其中通过某
阅读全文
摘要:import matplotlib.pyplot as plt 2021/10/21 双轴绘图 # 画图 fig, ax1 = plt.subplots(figsize = (15, 5), facecolor='white') # 左轴 ax1.bar(x, y1, label='计数', col
阅读全文
摘要:AUC:TPR为纵轴,FPR为横轴,不同阈值下的散点连成ROC曲线,曲线下与x轴围合的面积即为AUC值 source:为什么搜索与推荐场景用AUC评价模型好坏? (qq.com) 1.AUC值与模型预测值的大小无关, 只关注排序效果, 所以特别适合排序业务 2.AUC值一个通俗易懂的解释: 例如0.
阅读全文
摘要:随机森林的生成方法 从样本集中通过重采样的方式产生n个样本。 建设样本特征数目为a,对n个样本选择a中的k个特征,用建立决策树的方式获得最佳分割点。 重复m次,产生m棵决策树。 多数投票机制进行预测。 随机森林的优点 (随机森林(Random forest,RF)的生成方法以及优缺点_zhongju
阅读全文
摘要:source: 归因分析(Attribution Analysis)模型解析 - 简书 (jianshu.com) 归因模型 末次互动 末次非直接点击*互动 末次渠道互动 首次互动 线性归因 时间衰减归因 基于位置归因(U型) Markov链模型: 计算各个状态的移除效应系数(移除该状态后整体转化率
阅读全文
摘要:2021/8/12 获客指标(一):UE模型 - 知乎 (zhihu.com) 获客环节的核心能力: 精准拿量能力. 扩大新增用户规模, 同时保证新用户质量 获客环节的关键问题: 目标用户 用户值多少钱(LTV), 成本(CPA, CAC), 多长时间回本 渠道质量, 资源分配 如何触达用户 产品和
阅读全文
摘要:source: 6000字拆解:麦当劳的私域,才叫牛逼! | 人人都是产品经理 (woshipm.com) 私域运营可以以较低成本、相对直接地触达用户,因此也成为各品牌商家普遍采取的获客方式。 那么,针对用户体量大的品牌,私域玩法应当如何搭建? 本篇文章里,作者从引流、社群、小程序、会员体系四个方面
阅读全文
摘要:在一个大规模的推荐系统中,我们可以从三个角度来理解多样化的推荐结果: quality: 供应与用户兴趣匹配 diversity: 发现/扩展用户兴趣 fairness: 对长尾和小众items公平 对于quality, 可以来自用户历史兴趣, 也可以是用户兴趣的发现和拓展. 我们可以对点击率, 时长
阅读全文
摘要:原博链接: 论文解读:Attention is All you need - 知乎 (zhihu.com) 注意力机制可以分为三步:一是信息输入;二是计算注意力分布α;三是根据注意力分布α 来计算输入信息的加权平均 Attention用于计算query与输入$X$的“相关程度”。 例如在中译英(?)
阅读全文
摘要:paper链接: Learning to Build User-tag Profile in Recommendation System - AMiner 原博链接:推荐系统遇上深度学习(九十八)-[微信]推荐系统中更好地学习用户-标签偏好 - 简书 (jianshu.com) outline: u
阅读全文
摘要:2021/8/16 某项指标下降的问题 一. 分析思路 0.基于产品的价值定位, 明确本次要解决的问题和目标 问题确认阶段. e.g. 判定DAU是否出现异常变化:常用的方法是:看日环比、周同比、以及最近30天的变化趋势。 可以基于经验判断异常变化的Δ,比如日环比、周同比上升或下降超过5%可以判定为
阅读全文
摘要:2021/8/6 FFM 相比FM的改进: 当特征$x_i$与每个$x_j$交叉时, 会根据$x_j$所属的不同field, 贡献出不同的隐向量$v_{if_j}$用于内积求权重. 具体地, FFM的特征组合项为: $$ y(x) = \omega_0 + \sum_{i=1}^n \omega_i
阅读全文
摘要:搜索的算法 在fmin中指定algo参数: from hyperopt import rand, anneal, tpe rand.suggest # 随机搜索 anneal.suggest # 模拟退火 tpe.suggest # TPE
阅读全文