2019年2月14日

02_输入检索词自动爬取百度搜索页标题信息

摘要: 背景:在百度每次输入关键词检索后,会出现很多的检索页,不利于有效阅读,为更方便收集检索信息,编写了一个可以收集每个检索页与检索词相关的十条检索信息(百度在每个检索页放置十条检索标题信息)。可以根据需要选择爬取多少检索页,通过修改main()函数的depth变量 1 import urllib.request 2 import re 3 4 def get_html_text(url,da... 阅读全文

posted @ 2019-02-14 12:30 Summer儿 阅读(2600) 评论(1) 推荐(0) 编辑

导航