pandas(一):选取部分(行、列)写入到另一个文件
一、选取列
import pandas as pd df = pd.read_csv('zhihutest.csv', sep="\t") # 类别特征(16) fixlen_category_columns = ['m_sex', 'm_access_frequencies', 'm_twoA', 'm_twoB', 'm_twoC', 'm_twoD', 'm_twoE', 'm_categoryA', 'm_categoryB', 'm_categoryC', 'm_categoryD', 'm_categoryE', 'm_num_interest_topic', 'num_topic_attention_intersection', 'q_num_topic_words', 'num_topic_interest_intersection' ] # 数值特征(7) fixlen_number_columns = ['m_salt_score', 'm_num_atten_topic', 'q_num_title_chars_words', 'q_num_desc_chars_words', 'q_num_desc_words', 'q_num_title_words', 'days_to_invite' ] target = ['label'] text = ["q_title_words"] #总列数 = 25 #数值列数: 7 #数值+类别 = 23 cols = target + fixlen_number_columns + fixlen_category_columns + text fout = df[cols] print(fout) fout.to_csv("zhihu.txt", mode='a', header=False, index=False, sep='\t')
二、选取行
import pandas as pd df = pd.read_csv('criteo_sampled_data.csv', sep=",", nrows =20000) df = df.sample(frac=1.0) cut_idx = int(round(0.2 * df.shape[0])) df_test, df_train = df.iloc[:cut_idx], df.iloc[cut_idx:] df_test.to_csv("criteo_train.txt", index=False, sep='\t') df_train.to_csv("criteo_test.txt", index=False, sep='\t')
分类:
pandas处理数据
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧