java网络爬虫基础学习(二)
正则表达式
正则表达式写法 | 含义 |
\d | 代表0-9的任意数字 |
\D | 代表任何非数字字符 |
\s | 代表空格类字符 |
\S | 代表非空格类字符 |
\p{Lower} | 代表小写字母[a-z] |
\p{Upper} | 代表大写字母[A-Z] |
\p{Alpha} | 代表字母 |
\p{Blank} | 代表空格或制表符 |
HTTP状态码
分类 | 描述 |
1** | 信息,服务器收到请求,需要请求者继续执行操作。 |
2** | 成功,操作被成功接收并处理。 |
3** | 重定向,需要进一步的操作已完成请求。 |
4** | 客户端错误,请求包含语法错误或无法完成请求。 |
5** | 服务器错误,服务器在处理请求的过程中发生了错误。 |