摘要:
Q A 这个项目属于哪个课程 2023数据采集与融合技术 组名、项目简介 组名:喵喵队、项目需求:设计出一个交互友好的多源异构数据的采集与融合的小应用 、项目目标:通过在网页中上传文本、图片、视频或音频分析其中的情感 、项目开展技术路线:前端3件套、Python、fastapi 团队成员学号 102 阅读全文
2023年12月14日
2023年11月15日
摘要:
数据采集与融合技术实践作业四 gitee仓库链接:gitee仓库链接 102102141 周嘉辉 作业① 熟练掌握 Selenium 查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容。 使用Selenium框架+ MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股” 阅读全文
2023年11月1日
摘要:
数据采集与融合技术实践作业三 gitee仓库链接:gitee仓库链接 102102141 周嘉辉 作业① 指定一个网站,爬取这个网站中的所有的所有图片,例如:中国气象网(http://www.weather.com.cn)。 使用scrapy框架分别实现单线程和多线程的方式爬取。 部分代码: cla 阅读全文
2023年10月12日
摘要:
数据采集与融合技术实践作业二 102102141 周嘉辉 作业① 在中国气象网(http://www.weather.com.cn)给定城市集合的7日天气预报,并保存在数据库。 完成代码: from bs4 import BeautifulSoup from bs4 import UnicodeDa 阅读全文
2023年9月27日
摘要:
数据采集与融合技术实践作业一 102102141 周嘉辉 作业① 要求:爬取给定网址(http://www.shanghairanking.cn/rankings/bcur/2020 )的数据,屏幕打印爬取的大学排名信息。 完成代码: import urllib.request from bs4 i 阅读全文