正则表达式 处理 pdf 复制之后的段内换行和段内空格问题 问题导向!!!!
------------恢复内容开始------------
不要让工具支配自己!
- 一定是在先导标号之后
- 在某个范围内的
这样可以获得一个范围
- 在标号之后的每一行
- 直到一个连续的空行
可以看到[\S\s]的作用
但是这不太符合要求
这样的范围可以匹配一个不含\n的段落
需要扩大这个范围
这样可以匹配一个大块
shit!三个小时,终于弄出来了!问题导向!!一定要先解决问题,就算是点亮技能点,也不要随意去探索,应该有目的地去研究,从实际问题入手!!!
--------行内空格
(?<=[^•○\s]) (?=\S)
------------恢复内容结束------------
本博文本意在于记录个人的思考与经验,部分博文采用英语写作,可能影响可读性,请见谅
本文来自博客园,作者:ZXYFrank,转载请注明原文链接:https://www.cnblogs.com/zxyfrank/p/15112567.html