1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 | from io import open import os def file_name(file_dir): "" " 获取某文件夹下,特定扩展名的文件名, 返回特定扩展名文件列表 "" " L=[] for root, dirs, files in os.walk(file_dir): for file in files: if os.path.splitext(file)[1] == '.txt' : #os.path.splitext()函数将路径拆分为文件名+扩展名 L.append(file) return L filedir = 'E:/pdfTotxt/txt/' L = file_name(file_dir=filedir) index=0 htmlFile= 'E:/pdfTotxt/txt/txt.html' for i in range(len(L)): if index<500 : fineName=L[i] txtFile=filedir+ '/' +L[i] f = open(txtFile, 'r' , encoding= 'UTF-8' ) content = f.read() print(content) index=index+1 with open(htmlFile, mode= 'a' ,encoding= 'UTF-8' ) as filename: filename.write( '<li>' ) filename.write( '<a target=_blank href=http://xxx/jimage/pdf/%E9%A1%B5%E9%9D%A2_' +fineName[3:6]+ '.jpg >' +L[i]+ '</a></br>' ) filename.write( '<pre>' ) filename.write(content) # 换行 filename.write( '</pre>' ) filename.write( '</li>' ) filename.write( '\n' ) # 换行 |
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 深入理解 Mybatis 分库分表执行原理
· 如何打造一个高并发系统?
· .NET Core GC压缩(compact_phase)底层原理浅谈
· 现代计算机视觉入门之:什么是图片特征编码
· .NET 9 new features-C#13新的锁类型和语义
· Spring AI + Ollama 实现 deepseek-r1 的API服务和调用
· 《HelloGitHub》第 106 期
· 数据库服务器 SQL Server 版本升级公告
· 深入理解Mybatis分库分表执行原理
· 使用 Dify + LLM 构建精确任务处理应用
2012-02-01 Target runtime Tomcat 7.0 is not defined