python 判断语种类别
使用langdetect 或者langid
安装
pip install langid
or
pip install langdetect
适用于linux系统
测试
#! /usr/bin/env python
# -*- coding: utf-8 -*-#
import langid
from langdetect import detect
from langdetect import detect_langs
from langdetect import DetectorFactory
DetectorFactory.seed = 0
def check(line):
lang_set = set()
for c in line.strip().split(" "):
lang_set.add(detect(c.title()))
return lang_set
def main(content_file):
with open(content_file, mode="r") as f:
for line in f:
print(f"{line.strip()}:{detect_langs(line.strip())}")
print(f"{line.strip()}:{langid.classify(line.strip())[0]}")
print(check(line))
if __name__ == '__main__':
# content_path = input("请输入文本路径:")
content_path = r"input_folder/demo.txt"
main(content_path)
不论你在什么时候开始,重要的是开始之后就不要停止。
不论你在什么时候结束,重要的是结束之后就不要悔恨。
分类:
Python
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律