1957

无聊蛋疼的1957写的低端博客
  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

python爬虫

Posted on 2012-12-01 15:46  1957  阅读(359)  评论(0编辑  收藏  举报

很屌丝的urllib2 + re

似乎现在xpath很火的说,但是才第一次听说,老老实实的用正则

然后一个队列。。。

然后BFS

其实最纠结的是编码

看你到python有个chardet的第三方库,不知道好用不。以后试下