2016年5月30日

1分钟快速生成用于网页内容提取的xslt

摘要: 在《Python即时网络爬虫项目说明》一文我们说过要做一个通用的网络爬虫,而且能节省程序员大半的时间,而焦点问题就是提取器使用的抓取规则需要快速生成。在python使用xslt提取网页数据一文,我们已经看到这个提取规则是xslt程序,在示例程序中,直接把一长段xslt赋值给变量,但是没有讲这一段xslt是怎么来的。 阅读全文

posted @ 2016-05-30 14:49 华天清 阅读(3588) 评论(1) 推荐(0) 编辑

导航