C# 使用 iTextSharp 将 PDF 转换成 TXT 文本
var pdfReader = new PdfReader("xxx.pdf"); StreamWriter output = new StreamWriter(new FileStream("处理结果.txt", FileMode.Create)); int pageCount = pdfReader.NumberOfPages; for (int pg = 1; pg <= pageCount; pg++) { ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy(); var value = PdfTextExtractor.GetTextFromPage(pdfReader, pg, strategy); value = value.Replace(" ", ""); Console.WriteLine(value); output.Write(value); } output.Flush(); output.Close(); Console.Write("处理完毕"); Console.ReadLine();
https://www.cnblogs.com/New-HackerHK/p/14853693.html
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步