数据采集作业4
Gitee文件夹链接:https://gitee.com/mrv666/victor-data/tree/master/作业4
作业①:
要求:
o熟练掌握 Selenium 查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容。
o使用Selenium框架+ MySQL数据库存储技术路线爬取“沪深A股”、“上证A股”、“深证A股”3个板块的股票数据信息。
候选网站:东方财富网:http://quote.eastmoney.com/center/gridlist.html#hs_a_board
输出信息:MYSQL数据库存储和输出格式如下,表头应是英文命名例如:序号id,股票代码:bStockNo……,
输出结果
作业②:
要求:
o熟练掌握 Selenium 查找HTML元素、实现用户模拟登录、爬取Ajax网页数据、等待HTML元素等内容。
o使用Selenium框架+MySQL爬取中国mooc网课程资源信息(课程号、课程名称、学校名称、主讲教师、团队成员、参加人数、课程进度、课程简介)
候选网站:中国mooc网:https://www.icourse163.org
输出信息:MYSQL数据库存储和输出格式
输出内容
Flume日志采集
到这里因未知错误,数据无法导入,可视化等都无法完成,余额也严重不足,本账号的任务宣告失败,接下来借用其他同学的账号重新完成任务