输出文件中不包含指定的多个排除词的行内容(双重遍历) 分类: python 小练习 2013-11-22 15:20 605人阅读 评论(0) 收藏
#coding:utf-8
import sys
import fileinput
excludeWord=[u'图片',u'贴图',u'海洋',u'青海',u'陕西',u'台',
u'家居',u'陕西',u'重庆',u'台湾',u'港澳',u'辽宁',u'游戏',u'上海',u'河南',u'湖南',u'江苏',u'重庆',u'黑龙江',u'哈尔滨',
u'湖北',u'江淮',u'安徽',u'母婴',u'旅游',u'海外',u'健康',u'吉林',u'四川',u'上海',u'天津',u'北京',u'长江',u'歙县',u'西班牙',u'意大利',
u'英国',u'法国',u'娱乐',u'潇湘',
u'新疆',u'青海',u'甘肃',u'宁夏',u'西藏',u'贵州',
u'海南',u'云南',u'广西新闻',u'广东',u'福建',
u'电影',u'video',u'江西',u'合肥',u'潮州',u'济宁',u'青岛',u'文体',
u'西南在线',u'大洋洲',u'南美',u'北美',u'非洲',u'欧洲',u'河北',
u'山西',u'台州',u'浙江新闻',u'台海新闻',u'厦门新闻',u'赣州新闻',u'九江新闻',
u'新余新闻',u'齐鲁微新闻',u'烟台新闻',u'三门峡新闻',u'河南新闻',u'洛阳信息港',
u'郑州新闻',u'海南新闻',u'黔江',u'每日甘肃网',u'甘肃新闻',u'新疆新闻',
u'地州新闻',u'东亚经贸',u'豫北新闻',u'沈阳新闻',u'长春新闻',u'武汉新闻',u'宁波新闻',u'绿城',u'杭州新闻',u'贵阳新闻',
u'昆明新闻',u'金农新闻',u'地产',u'汽车',u'娄底新闻',u'宣城新闻',u'荆州新闻',u'攀西新闻',u'成都新闻',u'漳州新闻',u'南昌新闻',
u'青海新闻',u'株洲新闻',u'安顺新闻',u'宜宾新闻',u'桂林新闻',u'岳塘新闻',u'新华贵州',u'道琼斯新闻',u'长春新闻网',
u'湘潭新闻',u'荆门新闻',u'新华新疆',u'龙岩房产网',u'曲靖新闻',u'株洲新闻',u'佛山新闻',u'油城新闻',u'临夏新闻',
u'贵州省',u'娱乐',u'张掖新闻',u'鹤城新闻',u'山西新闻',u'常州新闻',u'书画',u'农大新闻',u'西邮新闻',
u'北京新闻',u'杭州新闻',u'巴中新闻',u'白山市政',
u'六安新闻',u'温州新闻',u'胶南',u'邳州新闻',u'日照市人民政府',
u'湛江',u'长汀新闻',u'人口计生',u'汽车',u'龙华',u'郴州新闻',u'嘉兴新闻',u'铁岭新闻',
u'修水',u'市井新闻',
u'綦江',u'盐城',u'人社',u'专利',u'崇左热线',u'黔西南',u'羊城晚报',u'宽带',u'喀什',u'遂宁',u'玩',
u'忻州',u'马鞍山',u'凌源',u'梧州',
]
#方法一:
def main(line):
for exclude in excludeWord:
#如果该行数据中含有排除词,则返回0
if exclude in line:
return 0
if __name__ == '__main__':
for line in fileinput.input(r'C:\Users\lovingJune\Documents\word.txt'):
#如果返回的值不是0,即改行不包含排除词,输出改行
if main(line)!=0:
print line
#方法二
def main():
for line in fileinput.input(r'C:\Users\lovingJune\Documents\word.txt'):
#增加判断标示,默认是0,即数据行不包含排除词
tag=0
for word in excludeWord:
#如果数据行包含排除词,则设置tag=1,跳出循环体,如果在数据行中遍历排除词后,tag仍是0,则输出改行。
if word in line:
tag=1
break
if tag==0:
print sys.stdout.write(line)
if __name__ == '__main__':
main()
版权声明:本文为博主原创文章,未经博主允许不得转载。