2022.3.29总结
今天继续学习了java的正则 了解了java的正则表达式语法和写了各种案例。
并了解了数据清洗与挖掘分析,看了整个数据清洗与挖掘分析的流程(中途很多地方都看不懂,很隐晦复杂),
准备开始初步着手,尝试清洗之前爬的小说里的乱码,但没有成功。
明天完结java正则,并开始从Hadoop上继续尝试今天失败的代码,
ackage uop;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class zhengze3 {
public static void main(String[] args) {
String content = "abc$(abc(123(";
String rehSr = "\\("; //两个斜杠(\\)代表转义
//需要用到转移符号的字符有如下:. * + () $ / \ ? [] ^ {}
Pattern rtd = Pattern.compile(rehSr);
Matcher matcher = rtd.matcher(content);
while (matcher.find()) {
System.out.println("找到:" + matcher.group(0));
}
}
}
package uop;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class zhengze2 {
public static void main(String[] args) {
String content="2002年5月,JDK1.3、JDK1.4和J2SE1.3相继发布,几周后其获得了Apple公司Mac OS X的工业标准的支持。2001年9月24日," +
"J2EE1.3发布。2002年2月26日,J2SE1.4发布。自此Java的计算能力有了大幅提升,与J2SE1.3相比,其多了近62%的类和接口。在这些新特性当中," +
"还提供了广泛的XML支持、安全套接字(Socket)支持(通过SSL与TLS协议)、全新的I/OAPI、正则表达式、日志与断言。2004年9月30日," +
"J2SE1.5发布,成为Java语言发展史上的又一里程碑。为了表示该版本的重要性,J2SE 1.5更名为Java SE 5.0(内部版本号1.5.0)," +
"代号为“Tiger”,Tiger包含了从1991年发布1.0版本以来的最重大的更新,其中包括泛型支持、基本类型的自动装箱、改进的循环、枚举类型、格式化I/O及可变参数。\n" +
"2005年6月,在Java One大会上,Sun公司发布了Java SE 6。此时,Java的各种版本已经更名,已取消其中的数字2,如J2EE更名为JavaEE,J2SE更名为JavaSE,J2ME更名为JavaME。 [12] \n" +
"2006年11月13日,Java技术的发明者Sun公司宣布,将Java技术作为免费软件对外发布。Sun公司正式发布的有关Java平台标准版的第一批源代码," +
"以及Java迷你版的可执行源代码。从2007年3月起,全世界所有的开发人员均可对Java源代码进行修改 [13] 。";
//目标:匹配所有四位数的数字
//1.\\d 表示一个任意数字
String rehStr = "\\d\\d\\d\\d";
//2.创建模式对象[即正则表达对象]
Pattern tra = Pattern.compile(rehStr);
//3创建一个匹配器 Matcher
//说明创建一个匹配器,按照这个正则表达式的规则去匹配content字符串
Matcher matcher = tra.matcher(content);
//开始匹配
while (matcher.find()){
System.out.println("找到:"+matcher.group(0));
}
}
}