随笔 - 633,  文章 - 0,  评论 - 13,  阅读 - 48万
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

代码:

复制代码
# 定义一个函数来处理文件
def process_file(src_filename, unique_filename):
    seen = set()
    duplicates = set()
    with open(src_filename, 'r', encoding='utf-8') as file:
        for line in file:
            # 将读取的行转换为小写,以避免大小写差异导致的重复
            normalized_line = line.strip().lower()
            if normalized_line in seen:
                duplicates.add(normalized_line)
            else:
                seen.add(normalized_line)

    # 打印重复的行
    for dup in duplicates:
        print(f"Duplicate: {dup}")

    # 将不重复的行写入新文件
    with open(unique_filename, 'w', encoding='utf-8') as file:
        for line in seen:
            file.write(line + '\n')


# 调用函数,指定源文件和新文件的名称
process_file('zhong.srt', 'unique.srt')
复制代码

 

posted on   大话人生  阅读(36)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构
点击右上角即可分享
微信分享提示