摘要: 前些天,写了个爬虫的博客,但是没有实现使用动态代理反反爬,今天补充下。如果想大量爬取数据,建议还是付费购买代理。 pom文件见:https://www.cnblogs.com/yhc-910/p/13440456.html package com.paic.ocss.fps.client.jsoup 阅读全文
posted @ 2020-08-20 10:24 稻草人_yhc 阅读(465) 评论(0) 推荐(0) 编辑
摘要: 本文主要使用Jsoup爬取XXX房屋信息,抓取一些房屋信息,比如房屋楼盘、户型、价格、地址等信息,然后保存到Excel,便于对比和筛选,选出符合预期的好房。 注意,有些网站有防爬取机制,需要设置动态更换代理IP进行重试。 1 <dependency> 2 <groupId>org.slf4j</gr 阅读全文
posted @ 2020-08-05 15:56 稻草人_yhc 阅读(431) 评论(0) 推荐(1) 编辑