02 2022 档案

摘要:tf模型线上部署需要采用saved_model形式,现将踩过的坑记录如下: """ Function: h5 model to pb to saved_model """ import os import keras import tensorflow import tensorflow as tf 阅读全文
posted @ 2022-02-25 16:12 今夜无风 阅读(702) 评论(0) 推荐(0) 编辑
摘要:来源:https://www.zhihu.com/question/515951059/answer/2349479254 阅读全文
posted @ 2022-02-16 20:04 今夜无风 阅读(40) 评论(0) 推荐(0) 编辑
摘要:loss的设计对系统来说至关重要,最初采用用户侧和商品侧向量的夹角余弦,binary_crossentropy进行优化,无法得到满意的模型效果,依托深度模型强大的拟合能力,特征向量居然全部归零。随后重新对系统改进,主要是1.负样本构建;2.loss函数设计 这里主要讲第二点。 基于距离的损失函数-- 阅读全文
posted @ 2022-02-16 14:25 今夜无风 阅读(540) 评论(0) 推荐(0) 编辑
摘要:1.多输入、多输出 模型某一层接收多输入数据,以实现共享该层参数的目的。如对title和desc做文本分类,两类可以共享一个embedding数据,进而获取某种关联特征,示例代码如下: title = Input(shape=(30,),name="title") desc = Input(shap 阅读全文
posted @ 2022-02-11 11:28 今夜无风 阅读(879) 评论(0) 推荐(0) 编辑
摘要:模型结构:双塔结构,包括user tower和item tower 重要的几点: 1.user tower包括了用户的年龄、性别、期望等基本属性,行为数据:搜索query及前7天历史query 2.item tower包括了物品数据(行业特性决定),title、skills、desc,纯文本形式 3 阅读全文
posted @ 2022-02-09 21:48 今夜无风 阅读(121) 评论(0) 推荐(0) 编辑
摘要:最近笔者在实验室做一些跨语言检索的研究,这是一种「面向相关性」的向量召回方法,然而在实际的搜索应用中,仅仅考虑相关性往往是不够的。尤其在候选量很大、计算资源有限的情况下,我们更希望优先召回高成交率的商品。 想要达到这种目标,需要在语义相关(Semantic)目标基础上增加「个性化」(Personal 阅读全文
posted @ 2022-02-09 20:57 今夜无风 阅读(607) 评论(0) 推荐(0) 编辑