摘要: 1. 点右上角的三个点 再找设置并点进去 2. 在搜索框输入Java 往下找网站设置并点进去 3. 找到关于Java的设置点进去 4. 点击如下图框里的选项即可禁用JavaScript 阅读全文
posted @ 2023-03-17 15:10 阿丽米热 阅读(24) 评论(0) 推荐(0) 编辑
摘要: 一、使用代理 如果使用自自身IP地址访问,很有可能被封IP,以后就访问不了了 那如何解决呢?我们可以使用代理IP(代理:) 设置超时,请求参数加上timeout=时间即可 异常处理:用try except 包一下即可 上传文件:虽然爬虫没有上传文件的需求 但是后期在开发过程中需要批量上传文件,这个时 阅读全文
posted @ 2023-03-17 14:55 阿丽米热 阅读(322) 评论(0) 推荐(0) 编辑
摘要: 本篇文章主要讲bs4模块(BeautifulSoup),这个模块能做么呢?用一句话来概括的话:beautifulsoup4 从HTML或XML文件中提取数据的Python库,用它来解析爬取回来的xml。从而从网站中精准爬取自己想要的内容。 它是Python的第三方模块,因此需要下载 pip inst 阅读全文
posted @ 2023-03-17 14:03 阿丽米热 阅读(104) 评论(0) 推荐(0) 编辑
Title