python实现的简单的epub2txt
等了1年,还是没等到台电k6的固件更新,好失望。
由于k6不支持epub的目录跳转、内嵌字体,且每次阅读均需要重新解压epub,既浪费电又浪费时间,因此干脆转成txt算了。
先用zipfile进行解压
然后用HTMLParser进行正文提取
最后输出同名txt
代码在 http://code.google.com/p/yaepub2txt 上托管,google code上的另外一个epub2txt似乎也是国内的兄弟写的,是基于html2txt的库和xml解析做的,我懒,直接解压,读html文件了事了B-)
posted on 2011-09-13 19:08 lifehacker 阅读(1713) 评论(0) 编辑 收藏 举报
【推荐】还在用 ECharts 开发大屏?试试这款永久免费的开源 BI 工具!
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步