qiezi_online

2020年12月6日

摘要： import pandas as pd df = pd.DataFrame(np.random.randn(3,4),columns=['a','b','c','d']) k = df.pop("b") df.insert(df.shape[1],"label",k) #将b列移到了最后一列去 df 阅读全文

posted @ 2020-12-06 16:17 qiezi_online 阅读(2980) 评论(0) 推荐(0) 编辑

csv 如何将txt文件转换成csv文件

摘要： import csvdef convert_txt_to_csv(out_file_path, input_file_path, txt_sep): #定义输出路径，输入文件路径，txt的分隔符 with open("./temp.csv", "w", newline = "") as csv_fi 阅读全文

posted @ 2020-12-06 15:51 qiezi_online 阅读(648) 评论(0) 推荐(0) 编辑

linux 复制文件前n行到另外一个文件

摘要： head -n 100 train.txt > 123.txt head -100 train.txt > 123.txt 阅读全文

posted @ 2020-12-06 15:14 qiezi_online 阅读(697) 评论(0) 推荐(0) 编辑

2020年12月4日

pytorch知识（torch.sum,以及维度问题）

摘要：参考（推荐）： https://mathpretty.com/12065.html 阅读全文

posted @ 2020-12-04 19:44 qiezi_online 阅读(358) 评论(0) 推荐(0) 编辑

deepFM(原理和pytorch理解)

摘要：参考（推荐）：https://blog.csdn.net/w55100/article/details/90295932 要点：其中的计算优化值得注意 K代表隐向量维数 n可以代表离散值one-hot后的全部维数（一般这样理解），也可以是n个field，每个域中取xi不为0的数（因为在使用fm1和阅读全文

posted @ 2020-12-04 17:24 qiezi_online 阅读(581) 评论(0) 推荐(0) 编辑

FM解析（因子分解机，2010）

摘要：推荐参考：（知乎） https://zhuanlan.zhihu.com/p/37963267 要点理解： 1.fm应用场景，为什么提出了fm（和lr的不同点） ctr预测，特征组合，fm的隐向量分解，lr的二次项 2.fm的两个好处第一，为什么在数据稀疏情况下有效？（1）首先来说数据稀疏，是因阅读全文

posted @ 2020-12-04 11:18 qiezi_online 阅读(279) 评论(0) 推荐(0) 编辑

2020年12月2日

读github,deepfm,pytorch源码记录

摘要：代码：https://github.com/chenxijun1029/DeepFM_with_PyTorch 2020/12/2首先是数据预处理文件：dataPreprocess.py1. 源数据集是kaggle上的criteo，train.txt第一列是label，txt文件不能直接用panda 阅读全文

posted @ 2020-12-02 19:40 qiezi_online 阅读(392) 评论(0) 推荐(0) 编辑

推荐系统（CTR领域）实战入门指南

摘要： CTR经典模型如：FM，FFM，Wide&Deep，建议自己去复现一个完整的通用模型先从pytorch版本入手（后期考虑tensorflow），从kaggle上找实际的比赛 github推荐： https://github.com/mJackie/RecSys CTR相关资料汇总 https:// 阅读全文

posted @ 2020-12-02 10:08 qiezi_online 阅读(878) 评论(0) 推荐(0) 编辑

2020年11月30日

xgboost 实践

摘要：参考：（博客园） https://www.cnblogs.com/pinard/p/11114748.html 实战 https://www.cnblogs.com/wanglei5205/p/8579244.html 参数说明调参大全： https://github.com/caijie1213 阅读全文

posted @ 2020-11-30 19:27 qiezi_online 阅读(85) 评论(0) 推荐(0) 编辑

pandas 获取列名

摘要： df.columns.values df.columns.values.tolist() 阅读全文

posted @ 2020-11-30 17:39 qiezi_online 阅读(342) 评论(0) 推荐(0) 编辑

公告