10 2012 档案

摘要:想看《蜀山》,就下载了蜀山剑侠传.txt.放在的电子书里。但看了会觉得文件挺大的,电子书加载起来也挺慢了,也没下着分回目版的,就想着把它按章回拆分到的各个文件。想想无非就是读取下文件,正则匹配一下,文件分割下,就完事大吉了。coding时觉得这种方式肯定慢, 不如去在线阅读的地方抓取一下。于是找到【蜀山剑侠传---还珠楼主---天涯在线书库】,把文件分割的问题变成屏幕抓取的问题。code:fromurllibimporturlopenimportretitleRe=re.compile('(?<="biaoti">).+?(?=</span> 阅读全文
posted @ 2012-10-27 16:46 码不能停 阅读(1896) 评论(1) 推荐(1) 编辑