上一页 1 2 3 4 5 6 7 8 ··· 11 下一页
摘要: import pandas as pd df = pd.DataFrame(np.random.randn(3,4),columns=['a','b','c','d']) k = df.pop("b") df.insert(df.shape[1],"label",k) #将b列移到了最后一列去 df 阅读全文
posted @ 2020-12-06 16:17 qiezi_online 阅读(2980) 评论(0) 推荐(0) 编辑
摘要: import csvdef convert_txt_to_csv(out_file_path, input_file_path, txt_sep): #定义输出路径,输入文件路径,txt的分隔符 with open("./temp.csv", "w", newline = "") as csv_fi 阅读全文
posted @ 2020-12-06 15:51 qiezi_online 阅读(648) 评论(0) 推荐(0) 编辑
摘要: head -n 100 train.txt > 123.txt head -100 train.txt > 123.txt 阅读全文
posted @ 2020-12-06 15:14 qiezi_online 阅读(697) 评论(0) 推荐(0) 编辑
摘要: 参考(推荐): https://mathpretty.com/12065.html 阅读全文
posted @ 2020-12-04 19:44 qiezi_online 阅读(358) 评论(0) 推荐(0) 编辑
摘要: 参考(推荐):https://blog.csdn.net/w55100/article/details/90295932 要点: 其中的计算优化值得注意 K代表隐向量维数 n可以代表离散值one-hot后的全部维数(一般这样理解),也可以是n个field,每个域中取xi不为0的数(因为在使用fm1和 阅读全文
posted @ 2020-12-04 17:24 qiezi_online 阅读(581) 评论(0) 推荐(0) 编辑
摘要: 推荐参考:(知乎) https://zhuanlan.zhihu.com/p/37963267 要点理解: 1.fm应用场景,为什么提出了fm(和lr的不同点) ctr预测,特征组合,fm的隐向量分解,lr的二次项 2.fm的两个好处 第一,为什么在数据稀疏情况下有效? (1)首先来说数据稀疏,是因 阅读全文
posted @ 2020-12-04 11:18 qiezi_online 阅读(279) 评论(0) 推荐(0) 编辑
摘要: 代码:https://github.com/chenxijun1029/DeepFM_with_PyTorch 2020/12/2首先是数据预处理文件:dataPreprocess.py1. 源数据集是kaggle上的criteo,train.txt第一列是label,txt文件不能直接用panda 阅读全文
posted @ 2020-12-02 19:40 qiezi_online 阅读(392) 评论(0) 推荐(0) 编辑
摘要: CTR经典模型如:FM,FFM,Wide&Deep,建议自己去复现一个完整的通用模型 先从pytorch版本入手(后期考虑tensorflow),从kaggle上找实际的比赛 github推荐: https://github.com/mJackie/RecSys CTR相关资料汇总 https:// 阅读全文
posted @ 2020-12-02 10:08 qiezi_online 阅读(878) 评论(0) 推荐(0) 编辑
摘要: 参考:(博客园) https://www.cnblogs.com/pinard/p/11114748.html 实战 https://www.cnblogs.com/wanglei5205/p/8579244.html 参数说明 调参大全: https://github.com/caijie1213 阅读全文
posted @ 2020-11-30 19:27 qiezi_online 阅读(85) 评论(0) 推荐(0) 编辑
摘要: df.columns.values df.columns.values.tolist() 阅读全文
posted @ 2020-11-30 17:39 qiezi_online 阅读(342) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 ··· 11 下一页