2011年4月17日
摘要: 最近开始打算重新学习C#,并且尝试做点C#练习。而最让我感兴趣的还是和网站相关的东西。那就做个获取网站源码,采集文章的功能吧。 根据网上的资料,使用WebClient来获取源码,很容易就能得到网页源码。但是,发现,不同网站的网页字符编码就不一样的,如何自动分别不同网 站的字符编码,而正确解释网页中的汉字呢。在C#里,提供了丰富的工具类库,可以轻松的转码。但是,却发现不能自动获取网站上的字符编码而自动正确的解释 源码,而导致汉字显示乱码。以前我也用JAVA做过这样的功能,获取网站源码,同样,在JAVA的各种获取网站源码的类库里,也不能自动根据网页字符编码 自动正确解释编码,只能我们自己手动来做了 阅读全文
posted @ 2011-04-17 20:01 钱途无梁 阅读(1003) 评论(0) 推荐(0) 编辑
摘要: http://www.iteye.com/wiki/topic/419518 阅读全文
posted @ 2011-04-17 18:48 钱途无梁 阅读(442) 评论(0) 推荐(0) 编辑