04 2022 档案

摘要:#pack_padded_sequence,pad_sequence的代码 import torch from torch.utils.data import Dataset,DataLoader from torch.nn.utils.rnn import pack_padded_sequence 阅读全文
posted @ 2022-04-28 20:08 15375357604 阅读(21) 评论(0) 推荐(0) 编辑
摘要:pyspark的一些函数: df.select('age', 'mobile').show(10) df.filter(df['mobile']=='Vivo').show() df.filter((df['mobile']=='Vivo')&(df['experience'] >10)).show 阅读全文
posted @ 2022-04-02 11:27 15375357604 阅读(447) 评论(0) 推荐(0) 编辑
摘要:推荐场景一般可以抽象为:内容(Item)和受众(User),其中内容主要是指要推荐的Item,在购物场景中Item就是商品,歌曲推荐中Item就是歌曲,受众是访问当前场景的用户,一般是自然行为人;推荐模型一般是计算不同的User-Item对的得分,这个得分反映的是用户点击当前物品的概率,获取得分最高 阅读全文
posted @ 2022-04-02 11:07 15375357604 阅读(299) 评论(0) 推荐(0) 编辑
摘要:前言 记得我入算法这一行的第一份工作面试的时候,最终的boss面的面试官是前微软工程院的副院长。面试进行得很顺利,不免向前院长卖弄一番,谈了谈我对算法的理解。我说算法工程师就好比厨师,模型是灶上功夫,而数据预处理+特征工程就好比刀工。再好的食材,不切不洗,一古脑地扔下锅,熟不熟都会成问题,更甭提味道 阅读全文
posted @ 2022-04-01 14:18 15375357604 阅读(81) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示