摘要:
下面有我整理的关于正则表达式的基本语法;具体案例网络爬虫 一.正则表示式语法 1.1普通字符 字母、数字、汉字、下划线、以及没有特殊定义的标点符 号都是“普通字符”。 1.2转义字符 与java中的转义字符一致 1.3标准字符集 \d \d 任意一个数字,0~9 中的任意一个 \w 任意一个字母或数 阅读全文
摘要:
java版的网络爬虫基本思路是,先获取网页信息,再根据正则表达式提取网页内容 package xuexi; import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; imp 阅读全文