移除txt文本中不必要的换行符

前一阵子看到刘慈欣老师的《三体3》出版了,很是兴奋,就从网上找到了《三体2》的txt,准备重温一下(不买纸质书,为了环保,家里书太多太重,表鄙视偶)。

 

打开一看,发现都出版了几年了,怎么网上连个像样的盗版都没有,明显是从扫描版pdf上使用文字识别ocr工具抓下来的文字,正确率倒还挺好,但有很多不必要的换行符,让人看起来非常吃力(如图)

 

于是,就花时间自己写了个小工具,来实现不必要换行符的剔除。

 

 

 试了试,效果很不错

 

源码下载:/Files/blodfox777/LineBreak.rar

 

程序下载: /Files/blodfox777/换行移除.rar

 

 

 

 

posted @   LanceZhang  阅读(11027)  评论(11编辑  收藏  举报
编辑推荐:
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· SQL Server 2025 AI相关能力初探
· 展开说说关于C#中ORM框架的用法!
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
点击右上角即可分享
微信分享提示