会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
最咸的鱼
博客园
首页
新随笔
联系
订阅
管理
2020年12月7日
语料处理 合集
摘要: 1.中文语料常常遇到编码问题,将任意字符集文件转为utf-8编码 1 import chardet 2 import codecs 3 from django.utils.encoding import smart_text 4 5 def check_file_charset(file): #查看
阅读全文
posted @ 2020-12-07 15:41 最咸的鱼
阅读(401)
评论(0)
推荐(0)
编辑