01 2021 档案

摘要:一、torch.nn.Embedding 模块可以看做一个字典,字典中每个索引对应一个词和词的embedding形式。利用这个模块,可以给词做embedding的初始化操作 torch.nn.Embedding(num_embeddings, embedding_dim, padding_idx=N 阅读全文
posted @ 2021-01-31 18:31 光彩照人 阅读(514) 评论(0) 推荐(0) 编辑
摘要:torch.utils.data.Dataset与torch.utils.data.DataLoader的理解 pytorch提供了一个数据读取的方法,其由两个类构成:torch.utils.data.Dataset和DataLoader 我们要自定义自己数据读取的方法,就需要继承torch.uti 阅读全文
posted @ 2021-01-31 10:40 光彩照人 阅读(417) 评论(0) 推荐(0) 编辑
摘要:常见的id类特征有用户特征user_id,物品特征item_id等,通常来说这类特征都是人为按顺序编码的特征,并不能反映用户或者物品的自然属性特征。但是在很多推荐相关的文章,都有提到使用这类特征,而且似乎还非常重要,并且除了推荐系统,在计算广告、反欺诈风控模型里都有成功的案例。这是为什么呢? 一、I 阅读全文
posted @ 2021-01-30 21:15 光彩照人 阅读(3833) 评论(0) 推荐(1) 编辑
摘要:原数据: df=pd.DataFrame({'a':[1,2,2,2,3,3,4,5,6]}) sns.kdeplot(df['a']) plt.xlim(-2,10) plt.show() df['a'].describe() 1 count 9.000000 2 mean 3.111111 3 阅读全文
posted @ 2021-01-12 15:10 光彩照人 阅读(9097) 评论(1) 推荐(1) 编辑
摘要:一、利用python衍生近几天的时间切片特征 源数据 stat_date id look gender 2020-9-1 1 1 1 2020-9-1 2 3 0 2020-9-2 1 1 1 2020-9-2 2 4 0 2020-9-3 3 5 0 2020-9-3 1 1 1 2020-9-3 阅读全文
posted @ 2021-01-06 09:57 光彩照人 阅读(1289) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示