查找文本文件中重复的汉字

查找文本文件中重复的汉字,找到在所在行号

文本文件格式

大
小
多
少
前
后
左
……

text.py

复制代码
import os
import re

list = []
same=0
total=0
index = []
with open("1.txt", "r", encoding="utf-8") as f:
    for line in f.readlines():
        line = line.strip('\n')  #去掉列表中每一个元素的换行符
        if len(line) ==0:
             break
        total +=1
        if line in list:
            print(line,"有多个在第",total,"")
            same=same+1
        list.append(line)
print("相同的有:",same,"")
print("一共有:",total,"个字")
import os
import re

list = []
same=0
total=0
index = []
with open("1.txt", "r", encoding="utf-8") as f:
    for line in f.readlines():
        line = line.strip('\n')  #去掉列表中每一个元素的换行符
        if len(line) ==0:
             break
        total +=1
        if line in list:
            print(line,"有多个在第",total,"")
            same=same+1
        list.append(line)
print("相同的有:",same,"")
print("一共有:",total,"个字")
复制代码

运行脚本

$python text.py
药 有多个在第 160 行
相同的有: 1 个
一共有: 200 个字

 

posted @   慕尘  阅读(350)  评论(0编辑  收藏  举报
(评论功能已被禁用)
相关博文:
阅读排行:
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
历史上的今天:
2020-04-15 java删除文本文件最后一行为NUL的字符
2020-04-15 spring boot集成zookeeper注册中心
点击右上角即可分享
微信分享提示