摘要: 正则表达式是一个非常有用的编程技能。一般来说,简单的抓取一个HTML页面的某一条信息,比如标题,是很容易实现的。但是,我们往往要抓取某一个列表页面里的多个重复的块里的特定内容,并且块还有嵌套的使用,我们抓取的则是每个重复块里的多个信息。同时,网页源文件不同于一般的字符串,其还存在大量的回车、换行和制... 阅读全文
posted @ 2015-01-20 16:09 SallyBin 阅读(5821) 评论(0) 推荐(0) 编辑