Write down , in case of forgetting
摘要: 简单爬虫R实现1、广度优先搜索策略网页的结构通常是一个页面包含正文和多个链接,这些链接大部分是域内链接,但也含有域外链接。通过对这些链接进行遍历,一层一层地搜索就可以搜索到所有页面。如图,网页结构已经很好的显示了一种图的层次结构。在这种图的结构中,简单地实现遍历,我们就可以采用两种遍历方式,广度优先... 阅读全文
posted @ 2014-05-13 12:58 doctor_q 阅读(452) 评论(0) 推荐(0) 编辑