会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
蔡晶晶
博客园
首页
新随笔
联系
订阅
管理
2020年4月24日
爬取芒果TV电视剧排行榜
摘要: 一、主题式网络爬虫设计方案 1.主题式网络爬虫名称:爬取软件之家软件下载排行榜 2.主题式网络爬虫爬取的内容:爬取软件下载排名、下载次数 3.主题式网络爬虫设计方案概述 实现思路:访问目标网页的源代码,使用get请求和BeautifulSoup解析工具爬取数据并采集保留,然后进行数据清洗和处理,数据
阅读全文
posted @ 2020-04-24 22:55 蔡晶晶
阅读(1466)
评论(0)
推荐(0)
2020年3月21日
抖音日榜热点前十及其热度
摘要: import requestsfrom lxml import etreeurl='https://tophub.today/n/DpQvNABoNE'header={'User-Agent':"Mozilla/5.0"}def get(url): try: data=requests.get(ur
阅读全文
posted @ 2020-03-21 19:45 蔡晶晶
阅读(918)
评论(0)
推荐(0)
公告