pandas筛选出某列中含有特定文本内容的所在行
1、所在行内容是单一的或者是标量
1 | df_fintech = df_text[df_text[ '业务一级分类' ]== "金融科技" ] |
2、所在行内容是割裂的
先转成str格式再用contains筛选
1 | df_fintech = df_text[df_text[ '业务一级分类' ].str.contains( "金融科技" )] |
3、筛选出列值属于某个范围内的行,用isin
1 | df.loc[df[ 'column_name' ].isin(some_values)] # some_values是可迭代对象 |
4、多种条件限制时使用&,&的优先级高于>=或<=,所以要注意括号的使用
1 | df.loc[(df[ 'column_name' ] >= A) & (df[ 'column_name' ] <= B)] |
5、筛选出列值不等于某个/些值的行
利用反选的思想:
1 2 | df.loc[df[ 'column_name' ] != 'some_value' ] df.loc[~df[ 'column_name' ].isin( 'some_values' )] #~取反 if values are str, remember to pass a list [ 'str1' , 'str2' ] |
在字符串pandas列中查找多个关键字的更有效方法示例(也就是上面第2个方法)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 | import pandas as pd # create regex pattern out of the list of words positive_kw = '|' . join ([ 'rise' , 'positive' , 'high' , 'surge' ]) negative_kw = '|' . join ([ 'sink' , 'lower' , 'fall' , 'drop' , 'slip' , 'loss' , 'losses' ]) neutral_kw = '|' . join ([ 'flat' , 'neutral' ]) # creating some fake data for demonstration words = [ 'rise high' , 'positive attitude' , 'something' , 'foo' , 'lowercase' , 'flat earth' , 'neutral opinion' ] df = pd.DataFrame(data=words, columns=[ 'words' ]) df[ 'positive' ] = df[ 'words' ].str.contains(positive_kw).astype( int ) df[ 'negative' ] = df[ 'words' ].str.contains(negative_kw).astype( int ) df[ 'neutral' ] = df[ 'words' ].str.contains(neutral_kw).astype( int ) print(df) |
6、用groupby分组并将每一组单独保存为excel文件(get_group)
1 2 3 4 5 6 7 8 9 10 | import pandas as pd from styleframe import StyleFrame file_name = "总表.xlsx" df = pd.read_excel(file_name, skiprows=1) rows = list( set (df[ "列标题" ])) group = df.groupby( "列标题" ) for row in rows: count = len( group .get_group(row)) group .get_group(row).to_excel(row+ str(count) + ".xlsx" ) |
参考:https://blog.csdn.net/weixin_43557139/article/details/109459352
https://www.coder.work/article/4980040
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· winform 绘制太阳,地球,月球 运作规律
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人