摘要: 1.作业①: 码云地址:https://gitee.com/wjz51/wjz/blob/master/project_5/5_1.py 1.1要求: 熟练掌握 Selenium 查找HTML元素、爬取Ajax网页数据、等待HTML元素等内容。使用Selenium框架爬取京东商城某类商品信息及图片。 阅读全文
posted @ 2021-11-24 21:50 王老大要去吃香喝辣 阅读(51) 评论(0) 推荐(0) 编辑
摘要: 1.作业①: 码云地址:https://gitee.com/wjz51/wjz/tree/master/project_4/4_1 1.1 要求: 熟练掌握 scrapy 中 Item、Pipeline 数据的序列化输出方法; Scrapy+Xpath+MySQL数据库存储技术路线爬取当当网站图书数 阅读全文
posted @ 2021-11-15 17:09 王老大要去吃香喝辣 阅读(38) 评论(0) 推荐(0) 编辑
摘要: 目录: 一、作业1: 1.要求 2.获取网页herf地址 3.获取图片地址 4.单线程: 4.1结果截图 4.2码云地址 5.多线程: 5.1结果截图 5.2码云地址 6.心得体会 二、作业2: 1.要求 2.items部分 3.sprider部分 4.settings部分 5.pipelines部 阅读全文
posted @ 2021-10-28 22:02 王老大要去吃香喝辣 阅读(77) 评论(0) 推荐(0) 编辑
摘要: 1. 作业①: 要求:在中国气象网(http://www.weather.com.cn)给定城市集的7日天气预报,并保存在 数据库。 输出信息: 序号 地区 日期 天气信息 温度 1 北京 7日(今天) 晴间多云,北部山区有阵雨或雷阵雨转晴转多云 31℃/17℃ 2 北京 8日(明天) 多云转晴,北 阅读全文
posted @ 2021-10-14 13:42 王老大要去吃香喝辣 阅读(46) 评论(0) 推荐(0) 编辑
摘要: 1.作业①: 要求:用urllib和re库方法定向爬取给定网址(https://www.shanghairanking.cn/rankings/bcsr/2020/0812 )的数据。 输出信息: 2020排名 全部层次 学校类型 总分 1 前2% 中国人民大学 1069.0 2...... 1)代 阅读全文
posted @ 2021-09-29 22:42 王老大要去吃香喝辣 阅读(54) 评论(0) 推荐(0) 编辑
摘要: 031904137;我是王敬梓,; 我的爱好是睡觉;我最喜欢99自助餐(玫瑰二层); 少年中国说;不想上早课。 阅读全文
posted @ 2021-09-10 19:24 王老大要去吃香喝辣 阅读(24) 评论(0) 推荐(0) 编辑