04 2022 档案
摘要:#pack_padded_sequence,pad_sequence的代码 import torch from torch.utils.data import Dataset,DataLoader from torch.nn.utils.rnn import pack_padded_sequence
阅读全文
摘要:pyspark的一些函数: df.select('age', 'mobile').show(10) df.filter(df['mobile']=='Vivo').show() df.filter((df['mobile']=='Vivo')&(df['experience'] >10)).show
阅读全文
摘要:推荐场景一般可以抽象为:内容(Item)和受众(User),其中内容主要是指要推荐的Item,在购物场景中Item就是商品,歌曲推荐中Item就是歌曲,受众是访问当前场景的用户,一般是自然行为人;推荐模型一般是计算不同的User-Item对的得分,这个得分反映的是用户点击当前物品的概率,获取得分最高
阅读全文
摘要:前言 记得我入算法这一行的第一份工作面试的时候,最终的boss面的面试官是前微软工程院的副院长。面试进行得很顺利,不免向前院长卖弄一番,谈了谈我对算法的理解。我说算法工程师就好比厨师,模型是灶上功夫,而数据预处理+特征工程就好比刀工。再好的食材,不切不洗,一古脑地扔下锅,熟不熟都会成问题,更甭提味道
阅读全文