输出文件中不包含指定的多个排除词的行内容(双重遍历) 分类: python 小练习 2013-11-22 15:20 605人阅读 评论(0) 收藏

#coding:utf-8
import sys
import fileinput
excludeWord=[u'图片',u'贴图',u'海洋',u'青海',u'陕西',u'台',
u'家居',u'陕西',u'重庆',u'台湾',u'港澳',u'辽宁',u'游戏',u'上海',u'河南',u'湖南',u'江苏',u'重庆',u'黑龙江',u'哈尔滨',
u'湖北',u'江淮',u'安徽',u'母婴',u'旅游',u'海外',u'健康',u'吉林',u'四川',u'上海',u'天津',u'北京',u'长江',u'歙县',u'西班牙',u'意大利',
u'英国',u'法国',u'娱乐',u'潇湘',
u'新疆',u'青海',u'甘肃',u'宁夏',u'西藏',u'贵州',
u'海南',u'云南',u'广西新闻',u'广东',u'福建',
u'电影',u'video',u'江西',u'合肥',u'潮州',u'济宁',u'青岛',u'文体',
u'西南在线',u'大洋洲',u'南美',u'北美',u'非洲',u'欧洲',u'河北',
u'山西',u'台州',u'浙江新闻',u'台海新闻',u'厦门新闻',u'赣州新闻',u'九江新闻',
u'新余新闻',u'齐鲁微新闻',u'烟台新闻',u'三门峡新闻',u'河南新闻',u'洛阳信息港',
u'郑州新闻',u'海南新闻',u'黔江',u'每日甘肃网',u'甘肃新闻',u'新疆新闻',
u'地州新闻',u'东亚经贸',u'豫北新闻',u'沈阳新闻',u'长春新闻',u'武汉新闻',u'宁波新闻',u'绿城',u'杭州新闻',u'贵阳新闻',
u'昆明新闻',u'金农新闻',u'地产',u'汽车',u'娄底新闻',u'宣城新闻',u'荆州新闻',u'攀西新闻',u'成都新闻',u'漳州新闻',u'南昌新闻',
u'青海新闻',u'株洲新闻',u'安顺新闻',u'宜宾新闻',u'桂林新闻',u'岳塘新闻',u'新华贵州',u'道琼斯新闻',u'长春新闻网',
u'湘潭新闻',u'荆门新闻',u'新华新疆',u'龙岩房产网',u'曲靖新闻',u'株洲新闻',u'佛山新闻',u'油城新闻',u'临夏新闻',
u'贵州省',u'娱乐',u'张掖新闻',u'鹤城新闻',u'山西新闻',u'常州新闻',u'书画',u'农大新闻',u'西邮新闻',
u'北京新闻',u'杭州新闻',u'巴中新闻',u'白山市政',
u'六安新闻',u'温州新闻',u'胶南',u'邳州新闻',u'日照市人民政府',
u'湛江',u'长汀新闻',u'人口计生',u'汽车',u'龙华',u'郴州新闻',u'嘉兴新闻',u'铁岭新闻',
u'修水',u'市井新闻',
u'綦江',u'盐城',u'人社',u'专利',u'崇左热线',u'黔西南',u'羊城晚报',u'宽带',u'喀什',u'遂宁',u'玩',
u'忻州',u'马鞍山',u'凌源',u'梧州',
]

#方法一:
def main(line):

        for exclude  in excludeWord:
            #如果该行数据中含有排除词,则返回0
            if exclude in line:
                return 0



if __name__ == '__main__':
    for line in fileinput.input(r'C:\Users\lovingJune\Documents\word.txt'):
        #如果返回的值不是0,即改行不包含排除词,输出改行
        if  main(line)!=0:
            print line

#方法二

def main():
    for line in fileinput.input(r'C:\Users\lovingJune\Documents\word.txt'):
        #增加判断标示,默认是0,即数据行不包含排除词
        tag=0
        for word in excludeWord:
            #如果数据行包含排除词,则设置tag=1,跳出循环体,如果在数据行中遍历排除词后,tag仍是0,则输出改行。
            if word in line:
                tag=1
                break
        if tag==0:
            print sys.stdout.write(line)

if __name__ == '__main__':
    main()



版权声明:本文为博主原创文章,未经博主允许不得转载。

posted @ 2013-11-22 15:20  前行者2011  阅读(191)  评论(0编辑  收藏  举报