摘要: (转)ASP.NET 抓取网页内容ASP.NET 抓取网页内容-文字ASP.NET 中抓取网页内容是非常方便的,而其中更是解决了 ASP 中困扰我们的编码问题。需要三个类:WebRequest、WebResponse、StreamReader。WebRequest、WebResponse的名称空间是:System.NetStreamReader的名称空间是:System.IO核心代码WebRequest request = WebRequest.Create("http://www.cftea.com/");WebResponse response = request.Ge 阅读全文
posted @ 2013-10-29 19:12 佬D 阅读(1222) 评论(0) 推荐(0) 编辑
摘要: (转)htmlparsefilter使用该类并不是一个通用的工具类,需要按自己的要求实现,这里只记录了Htmlparse.jar包的一些用法。仅此而已!详细看这里:http://gundumw100.javaeye.com/blog/704311import java.util.*; import org.htmlparser.Node; import org.htmlparser.NodeFilter; import org.htmlparser.Parser; import org.htmlparser.filters.AndFilter; import org.htm... 阅读全文
posted @ 2013-10-29 18:59 佬D 阅读(4176) 评论(0) 推荐(2) 编辑