提取txt文件，读取多种编码格式！

废话少说，直接上代码：

复制代码

import chardet


# 抽取txt文件内容
def parseTxt(filename):
    texts = []
    encoding = chardet.detect(open(filename, 'rb').read()).get('encoding', 'utf-8')
    with open(filename, "r", encoding=encoding) as f:
        for item in f.readlines():
            texts.append(item)
    return {
        "title": texts[0][:100],
        "content": texts
    }

复制代码

posted @ 2021-01-28 19:46 数据驱动阅读(490) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区，博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】博客园社区专享云产品让利特惠，阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

编辑推荐：
· 为什么说在企业级应用开发中，后端往往是效率杀手？
· 用 C# 插值字符串处理器写一个 sscanf
· Java 中堆内存和栈内存上的数据分布和特点
· 开发中对象命名的一点思考
· .NET Core内存结构体系(Windows环境)底层原理浅谈

阅读排行：
· 为什么说在企业级应用开发中，后端往往是效率杀手？
· DeepSeek 解答了困扰我五年的技术问题。时代确实变了！
· 本地部署DeepSeek后，没有好看的交互界面怎么行！
· 趁着过年的时候手搓了一个低代码框架
· 推荐一个DeepSeek 大模型的免费 API 项目！兼容OpenAI接口！

公告

昵称：数据驱动
园龄： 5年6个月
粉丝： 11
关注： 2

<

2025年2月

>

日

一

二

三

四

五

六

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

1

2

3

4

5

6

7

8

随笔分类

阅读排行榜

评论排行榜

1. python生成requirements.txt的两种方法(2)

推荐排行榜

最新评论

1. Re:python生成requirements.txt的两种方法
感谢提到了encoding=utf8的问题
--Mixue618
2. Re:python生成requirements.txt的两种方法
第二种方法真好用
--幸福的菜菜