随笔 - 1313, 文章 - 2, 评论 - 154, 阅读 - 423万
  首页  :: 新随笔  :: 管理

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
from io import open
import os
 
def  file_name(file_dir):
    """
    获取某文件夹下,特定扩展名的文件名,
    返回特定扩展名文件列表
    """
    L=[]
    for root, dirs, files in os.walk(file_dir):
        for  file  in files:
            if os.path.splitext(file)[1] ==  '.txt': #os.path.splitext()函数将路径拆分为文件名+扩展名
                L.append(file)
    return L
 
 
 
 
 
 
filedir = 'E:/pdfTotxt/txt/'
L = file_name(file_dir=filedir)
index=0
htmlFile= 'E:/pdfTotxt/txt/txt.html'
for i in range(len(L)):
    if index<500 :
        fineName=L[i]
        txtFile=filedir+'/'+L[i]
        f = open(txtFile, 'r', encoding='UTF-8')
        content = f.read()
        print(content)
        index=index+1
        with open(htmlFile, mode='a',encoding='UTF-8') as filename:
            filename.write('<li>')
            filename.write('<a target=_blank  href=http://xxx/jimage/pdf/%E9%A1%B5%E9%9D%A2_'+fineName[3:6]+'.jpg >'+L[i]+'</a></br>')
            filename.write('<pre>')
            filename.write(content)  # 换行
            filename.write('</pre>')
            filename.write('</li>')
            filename.write('\n')  # 换行

  

编辑推荐:
· 深入理解 Mybatis 分库分表执行原理
· 如何打造一个高并发系统?
· .NET Core GC压缩(compact_phase)底层原理浅谈
· 现代计算机视觉入门之:什么是图片特征编码
· .NET 9 new features-C#13新的锁类型和语义
阅读排行:
· Spring AI + Ollama 实现 deepseek-r1 的API服务和调用
· 《HelloGitHub》第 106 期
· 数据库服务器 SQL Server 版本升级公告
· 深入理解Mybatis分库分表执行原理
· 使用 Dify + LLM 构建精确任务处理应用
历史上的今天:
2012-02-01 Target runtime Tomcat 7.0 is not defined
智读 | 成都会领科技有限公司官网 | 智读App下载 | 每天听本书的博客 | |
点击右上角即可分享
微信分享提示