会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
IT
博客园
首页
新随笔
新文章
联系
订阅
管理
2009年3月17日
解决网爬工具爬取页面信息出现乱码的问题
摘要: 问题: 网爬工具中自动搜集页面信息时,有的页面出现了出现乱码现象 原因: 读取页面信息是使用了错误的编码类型。C#.NET从现在的类中获取得来的编码信息有时是错误的,本人认为对不是ASP.NET的应用程序,它读过来的编码信息都是错误的。 解决: 思路:必须先在运行时获取得该页面的编码,再去读取页面的内容,这样得来的页面内容才不会出现乱码现象。 方法:...
阅读全文
posted @ 2009-03-17 10:07 liufei
阅读(276)
评论(0)
推荐(0)
编辑