java网络爬虫基础学习(二)

正则表达式

正则表达式写法 含义
\d 代表0-9的任意数字
\D 代表任何非数字字符
\s 代表空格类字符
\S 代表非空格类字符
\p{Lower} 代表小写字母[a-z]
\p{Upper} 代表大写字母[A-Z]
\p{Alpha} 代表字母
\p{Blank} 代表空格或制表符

HTTP状态码

分类 描述
1** 信息,服务器收到请求,需要请求者继续执行操作。
2** 成功,操作被成功接收并处理。
3** 重定向,需要进一步的操作已完成请求。
4** 客户端错误,请求包含语法错误或无法完成请求。
5** 服务器错误,服务器在处理请求的过程中发生了错误。
posted @ 2019-04-20 01:38  芒果绿  阅读(298)  评论(0编辑  收藏  举报