04 2019 档案

摘要:1. " java爬虫系列第一讲 爬虫入门(爬取动作片列表)" 2. " java爬虫系列第二讲 爬取最新动作电影《海王》迅雷下载地址" 3. " java爬虫系列第三讲 获取页面中绝对路径的各种方法" 4. " java爬虫系列第四讲 采集"极客时间"专栏文章、视频专辑" 5. "java爬虫系列 阅读全文
posted @ 2019-04-23 11:54 路人甲Java 阅读(520) 评论(1) 推荐(0) 编辑
摘要:本文内容 1、分析一下爬虫存在的问题及解决方案 2、webmagic中代理的使用 3、目前市面上一些比较好用的代理服务器 存在的问题 我们在使用爬虫过程中,大多都会遇到这样的问题:突然某一天爬虫爬不到内容了,目标网站直接返回404或者其他错误信息,这说明我们的爬虫被目标网站给屏蔽了。 爬虫被屏蔽的原 阅读全文
posted @ 2019-04-23 11:51 路人甲Java 阅读(3748) 评论(0) 推荐(0) 编辑
摘要:在使用webmgiac的过程中,很多时候我们需要抓取连接的绝对路径,总结了几种方法,示例代码放在最后。 以和讯网的一个 "页面" 为例: xpath方式获取 xpath+css选择器方式获取 css选择器方式获取 jsoup方式获取 jsoup中stringutil工具类方式获取 示例代码 ​执行结 阅读全文
posted @ 2019-04-22 11:03 路人甲Java 阅读(1302) 评论(0) 推荐(0) 编辑
摘要:1. 概述 java爬虫系列包含哪些内容? 1. java爬虫框架webmgic入门 2. 使用webmgic爬取 http://ady01.com 中的电影资源(动作电影列表页、电影下载地址等信息) 3. 使用webmgic爬取 极客时间 的课程资源(文章系列课程 和 视频系列的课程) 本篇文章主 阅读全文
posted @ 2019-04-21 11:41 路人甲Java 阅读(2149) 评论(2) 推荐(0) 编辑
摘要:spring aop中pointcut表达式完整版 本文主要介绍spring aop中9种切入点表达式的写法 1. execute 2. within 3. this 4. target 5. args 6. @target 7. @within 8. @annotation 9. @args 0. 阅读全文
posted @ 2019-04-21 11:11 路人甲Java 阅读(16832) 评论(0) 推荐(4) 编辑