摘要:
1. 按照做特征的方式来划分 做特征的注意点: 1. 判断是否离线和实时特征的关系或者叫必要性,有些场景item和用户在短时间内变化不大,就没有必要做实时特征了。 2. 特征冗余程度 3. 特征获取的难易程度 4. 特征和用户感受的直接关系 5. 查看特征值域分布情况 2. 按照特征对象来划分 阅读全文
摘要:
以前看过一本名叫《复盘》的书籍,第一次接触了复盘这件事情,了解了复盘的整体操作步骤,后来实时做复盘。 但是在后来复盘的过程中经常觉得很累,因为在复盘中总是不断细究错误,把大多数事务的失败都归结到自己的身上,自责感和失败感很重,所以有些讨厌复盘了。 经过老师的开导重新理解复盘这件事,所以记录一些重点。 阅读全文
摘要:
广告推荐 要求更精确,预测结果高了或者低了都会影响广告主对业务的投放 广告数据内容不同,广告特征更少 广告数据多变,修改操作频繁 竞价机制+人工调整操作 是广告主、媒体和用户的三方博弈,有相关的博弈技术,Bidding策略,排期优化、智能预算控制 还需要考虑反作弊机制 直播推荐 时间差 内容推荐 看 阅读全文
摘要:
关于transformer的所有疑问点都在这些文章中回答了,记录一下。 位置编码综述文章:https://kexue.fm/archives/8130 多头数量和效果的讨论:https://blog.csdn.net/abcdefg90876/article/details/105236500?sp 阅读全文
摘要:
各个网站都说shell 在函数内部echo,调用函数时,使用$? 获取函数值。 但是我在使用时,无法获取输出。 只能换成$(funcation name) 才能获取函数输出。不知道为啥。。。。 阅读全文
摘要:
1. 写作的主要目的 1.1. result的主要目的 说明使用什么方法得到什么实验结果;参考实验结果,描述实验发现;总结和概括实验结果和实验规律。 ps:应该选择部分具有代表意义的或者是反常的数据,切忌所有数据事无巨细。 1.2. discussion的主要目的 选择合适的讨论对象进行讨论,讨论对 阅读全文
摘要:
1. 写作目的(内在逻辑顺序) 为什么要做这个研究:背景知识,研究的问题定义,研究内容的重要性,现在研究存在的问题(占比50%+)。 领域空白:新功能、新技术、新方案,对应理论重要性、应用重要性、科研推动性、发展进步性和理解深入性(可省略)。 我们的研究内容做什么:大致描述研究策略、方式和内容(占比 阅读全文
摘要:
推荐系统中最重要的两部分是特征和模型,早期模型上没有很大突破的时候,人工特征工程是推荐系统发展的主要方向。在这里我总结一下做特征工程的思路和不同特征的处理方式。 1. 创造特征的思路 业务背景特征 在推荐系统中猜测用户是否点击内容,可以仔细分析用户从打开手机到看到推荐内容的整个过程中的任何因素,比如 阅读全文
摘要:
XGBoost 讲的非常好的链接:https://snaildove.github.io/2018/10/02/get started XGBoost/ 开始的优化目标根据加法模型和MSE的推导可以变成和第t棵树的一阶导和二阶导的关系, 再利用ft等于样本所在叶子节点上的权重,可以得到目标函数和样本 阅读全文
摘要:
Bagging vs. Boosting Bagging和Boosting是树模型集成的两种典型方式。Bagging集成随机挑选样本和特征训练不同树,每棵树尽可能深,达到最高的精度。依靠小偏差收敛到理想的准确率。Boosting算法注重迭代构建一系列分类器, 每次分类都将上一次分错的样本的权重提高, 阅读全文