10 2023 档案
2023数据采集与融合技术实践第三次作业
摘要:作业①: 要求: 指定一个网站,爬取这个网站中的所有的所有图片,例如:中国气象网(http://www.weather.com.cn)。使用scrapy框架分别实现单线程和多线程的方式爬取。 –务必控制总页数(学号尾数2位)、总下载的图片数量(尾数后3位)等限制爬取的措施。 输出信息: 将下载的Ur
2023数据采集与融合技术实践第二次作业
摘要:作业①: 要求: 在中国气象网(http://www.weather.com.cn)给定城市集的 7日天气预报,并保存在数据库。 代码: 核心程序 soup = BeautifulSoup(data, "lxml") lis = soup.select("ul[class='t clearfix']