会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
狮主
博客园
首页
新随笔
联系
订阅
管理
2019年10月20日
github文件的爬取
摘要: 第一次写爬虫,爬取了简单的百度搜索界面的信息,感觉要成为爬虫大佬,要走的路还很长。所以这次就挑战一下更高的难度,爬取github上的信息。 过程是先在github上搜索关键词,搜索后刷新出来搜索结果的页面,再根据搜索结果页面提取出每条结果的URL链接,可根据自己想要的文件进行函数过滤或者正则过滤,保
阅读全文
posted @ 2019-10-20 17:49 狮主
阅读(1136)
评论(0)
推荐(1)
编辑
公告