TinyHtmlParser开源喽
优点: 高效、简单、易用的Html解析器。
学习时间,分分钟。
解析速度超过,查找速度超快,支持格式化。
有强悍的容错性,即使HTML标签不规范,也会尽可以进行匹配,弥补,正确纠错率达95%以上。即使不能正确纠错,也不会导致解析不下去。
支持大小写混合匹配,即开始标签与结束标签为<HTML>和</html>也可以正确的进行匹配。
Maven引用坐标:
1 | <dependency> |
2 | <groupId>org.tinygroup</groupId> |
3 | <artifactId>htmlparser</artifactId> |
4 | <version>0.0.12</version> |
5 | </dependency> |
使用方式,请参考http://my.oschina.net/tinyframework/blog/194574
只要把文中的Xml变成Html就完全适用。