摘要: 折腾 数据分析用惯了R,感觉pandas用起来就有点反人类了。今天用python的pandas处理数据时两个数据框硬是合并不起来。 我有两个数据框,列名是未知的,只能知道索引,以及哪两个索引是用做主键合并的。(别问我为啥列名未知,因为我是开发工具)。 思路是这样的,找到主键列,重命名,再合并。 df 阅读全文
posted @ 2021-07-07 22:30 生物信息与育种 阅读(1372) 评论(0) 推荐(0) 编辑
摘要: 问题来源 我有两个文件,一个是plink过滤后得到的.fam文件(空格分隔);另一个是样本对应关系文件(tab分隔)。 文件1: 文件2: 两个文件匹配,awk常规操作。这里我想要保留文件2中和文件1第一二列匹配得到的样本(匹配后文件2的第一列)。当然这里两个文件数目是一样的,所以应该全部匹配才对( 阅读全文
posted @ 2021-07-07 20:26 生物信息与育种 阅读(370) 评论(0) 推荐(0) 编辑