合集-我的爬虫作业

摘要:作业1 要求 用requests和BeautifulSoup库方法定向爬取给定网址(http://www.shanghairanking.cn/rankings/bcur/2020 )的数据,屏幕打印爬取的大学排名信息。 输出信息 Code from bs4 import BeautifulSoup 阅读全文
posted @ 2023-09-21 16:56 liyishui 阅读(138) 评论(1) 推荐(1) 编辑
摘要:作业1 要求: 在中国气象网(http://www.weather.com.cn)给定城市集的 7日天气预报,并保存在数据库。 输出信息: gitee文件夹链接 Code from bs4 import BeautifulSoup from bs4 import UnicodeDammit impo 阅读全文
posted @ 2023-10-07 20:36 liyishui 阅读(82) 评论(1) 推荐(0) 编辑
摘要:作业1 要求 指定一个网站,爬取这个网站中的所有的所有图片(亚马逊购物网站:https://origin-www.amazon.cn),使用scrapy框架分别实现 单线程和多线程的方式爬取。 输出信息 将下载的UrI信息在控制台输出,并将下载的图片存储在images子文件中,并给出截图。 spid 阅读全文
posted @ 2023-11-02 02:38 liyishui 阅读(28) 评论(0) 推荐(0) 编辑
摘要:作业1 要求 熟练掌握 Selenium 查找 HTML 元素、爬取 Ajax 网页数据、等待 HTML 元素等内容 使用 Selenium 框架+ MySQL 数据库存储技术路线爬取“沪深 A 股”、“上证 A 股”、“深证 A 股”3 个板块的股票数据信息。 候选网站:东方财富网http://q 阅读全文
posted @ 2023-11-08 23:25 liyishui 阅读(41) 评论(0) 推荐(0) 编辑
摘要:1. 基本信息 这个项目属于哪个课程 https://edu.cnblogs.com/campus/fzu/2023DataCollectionandFusiontechnology 组名 冲就完事 项目简介 当我们置身于日常生活或旅途中,常会被美景所震撼,但往往难以找到合适的诗句来表达内心的感悟。 阅读全文
posted @ 2023-12-14 21:54 liyishui 阅读(81) 评论(1) 推荐(0) 编辑

点击右上角即可分享
微信分享提示