hexo-migrator博客园搬家至hexo工具

1.前言

前阵子搭建了hexo博客,但是没有能直接搬家的工具,所以就自己用Python写了一个小工具进行搬家

github仓库地址:https://github.com/vhyz/hexo-migrator

2.支持哪些博客

这个工具适合老博客就用Markdown写文章的人,因为Markdown编辑器渲染后的html的可以转化为markdown

但是不是用markdown编辑器写的文章渲染出来的html是无法直接转化为markdown,当然如果要写的话应该还是可以写出来的

但是由于Markdown编辑器可以内嵌html标签,也就是说如果直接把文章的主体html导入其实也是可以实现博客搬家功能的

当然前提是你没有用一些CSS渲染你的博客文章,

3. 爬取博客园分类时遇到的麻烦

博客园分类是js脚本加载出来的,是无法直接通过静态爬取出来的,刚开始使用了模拟浏览器抓取该内容

但是耗时实在是太久了,后来查了一下资料,可以通过分析请求来判断哪个链接是请求分类的js

然后我们模拟发送该请求即可获得该信息,获得了该信息可以用正则表达式来处理

但正则表达式比较水的我,还是选择了直接用字符串处理即可获得该内容

4.json设置

该工具理论上只要你将对应的json设置导入到该工具的Setting文件夹中,你就能实现任何博客到hexo搬家的功能

但是由于某些博客的结构不同等等,需要人工修改一下源爬取代码

posted @ 2018-04-20 19:23  vhyz  阅读(397)  评论(0编辑  收藏  举报