01 2021 档案
摘要:一、torch.nn.Embedding 模块可以看做一个字典,字典中每个索引对应一个词和词的embedding形式。利用这个模块,可以给词做embedding的初始化操作 torch.nn.Embedding(num_embeddings, embedding_dim, padding_idx=N
阅读全文
摘要:torch.utils.data.Dataset与torch.utils.data.DataLoader的理解 pytorch提供了一个数据读取的方法,其由两个类构成:torch.utils.data.Dataset和DataLoader 我们要自定义自己数据读取的方法,就需要继承torch.uti
阅读全文
摘要:常见的id类特征有用户特征user_id,物品特征item_id等,通常来说这类特征都是人为按顺序编码的特征,并不能反映用户或者物品的自然属性特征。但是在很多推荐相关的文章,都有提到使用这类特征,而且似乎还非常重要,并且除了推荐系统,在计算广告、反欺诈风控模型里都有成功的案例。这是为什么呢? 一、I
阅读全文
摘要:原数据: df=pd.DataFrame({'a':[1,2,2,2,3,3,4,5,6]}) sns.kdeplot(df['a']) plt.xlim(-2,10) plt.show() df['a'].describe() 1 count 9.000000 2 mean 3.111111 3
阅读全文
摘要:一、利用python衍生近几天的时间切片特征 源数据 stat_date id look gender 2020-9-1 1 1 1 2020-9-1 2 3 0 2020-9-2 1 1 1 2020-9-2 2 4 0 2020-9-3 3 5 0 2020-9-3 1 1 1 2020-9-3
阅读全文