摘要:
由于我经常下载一些pdf格式的电子书,有的时候一些好书下载下来没有书签,读起来感觉没有整体的感觉,所以决定自己写一个小工具,将特定格式的文本解析成为书签,然后保存到pdf格式中。整体思路是从豆瓣啊、京东啊、当当啊、亚马逊下面的介绍中可以copy出目录信息,拿《HTTP权威指南》为例:目录的结构如:第1章 HTTP 概述 31.1 HTTP——因特网的多媒体信使 41.2 Web 客户端和服务器 41.3 资源 51.3.1 媒体类型 61.3.2 URI 71.3.3 URL 71.3.4 URN 81.4 事务 91.4.1 方法 91.4.2 状态码 101.4.3 Web 页面中可以包含 阅读全文