摘要:
这是对之前知识的补漏:必须要拿适当的曝光未点击最为hard负样本,线上才能得到较好的效果。理论依据如下: 阅读全文
摘要:
推荐中的重要用户特征: 1)用户画像,基础属性信息; 2)环境特征,一线还是45线小城镇; 3)资讯特征,新闻or搞笑or即时资讯; 4)相关性特征,关键词匹配特征,类别特征,匹配程度; 5)热度特征,有热度的咨询会做全局推送; 6)协同特征,比较强大的工具,系统过滤模型通过作品的相似程度进行推送 阅读全文
摘要:
对于我来说仓位管理是至关重要的,不管是合约还是投资,它在我的交易系统里是独占一个大分支的,有很多详细规则约束着。 我只说些浅的,更多的我肯定自己藏着,靠你自己揣摩。 以最简单的合约举例,我会大致分为四部分 第一阶段:建仓(也可以叫试仓)目的是确定此项交易是否,同时也要根据建仓的多少规划后续仓位分配, 阅读全文
摘要:
from keras import Sequential, Model from keras.optimizers import Adam from keras.callbacks import ModelCheckpoint, ReduceLROnPlateau from keras.layers 阅读全文
摘要:
对于变长特征编码,我们往往需要用到此。它们的作用是: Padding:将本来不相同的样本填充到相同的长度,以便于后面的处理,我们一般使用0做填充 Mask:告诉网络层那些是真正的数据,哪些是填充的“0”,从而帮助网络层更好地计算 目的:提升序列模型的精度和准确率 使用方法如下: # 第一步,将数据p 阅读全文
摘要:
tf模型线上部署需要采用saved_model形式,现将踩过的坑记录如下: """ Function: h5 model to pb to saved_model """ import os import keras import tensorflow import tensorflow as tf 阅读全文
摘要:
来源:https://www.zhihu.com/question/515951059/answer/2349479254 阅读全文
摘要:
loss的设计对系统来说至关重要,最初采用用户侧和商品侧向量的夹角余弦,binary_crossentropy进行优化,无法得到满意的模型效果,依托深度模型强大的拟合能力,特征向量居然全部归零。随后重新对系统改进,主要是1.负样本构建;2.loss函数设计 这里主要讲第二点。 基于距离的损失函数-- 阅读全文
摘要:
1.多输入、多输出 模型某一层接收多输入数据,以实现共享该层参数的目的。如对title和desc做文本分类,两类可以共享一个embedding数据,进而获取某种关联特征,示例代码如下: title = Input(shape=(30,),name="title") desc = Input(shap 阅读全文
摘要:
模型结构:双塔结构,包括user tower和item tower 重要的几点: 1.user tower包括了用户的年龄、性别、期望等基本属性,行为数据:搜索query及前7天历史query 2.item tower包括了物品数据(行业特性决定),title、skills、desc,纯文本形式 3 阅读全文