WebRequest抓取网页数据出现乱码问题

今天项目里突然有个功能用不起来了,本机确实好的 ,这个很无语 不知道为啥

经过写日志发现html 变成了这样的东西,很是头疼,刚开始各种编码转换,发现这并不是编码的问题

 

 

 

后面观察目标网站多了一个gzip压缩标识,开始尝试解压Gzip 

找到AutomaticDecompression属性:

 

1
request.AutomaticDecompression = DecompressionMethods.GZip | DecompressionMethods.Deflate;

 

官方说明:https://docs.microsoft.com/en-us/dotnet/api/system.net.httpwebrequest.automaticdecompression?redirectedfrom=MSDN&view=netframework-4.8

 

 

写出日志变正常了,正常写出html源代码 

 

但是一直搞不明白 ,没加这句话之前为啥我本机正常,而服务器却不行。。有点无解啊

 

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
public static string Fetch(string sourceUrl)
        {
            string html = string.Empty;
            HttpWebRequest request = HttpWebRequest.Create(sourceUrl) as HttpWebRequest;
            request.AutomaticDecompression = DecompressionMethods.GZip | DecompressionMethods.Deflate; //加入了自动减压特性
            using (HttpWebResponse response = request.GetResponse() as HttpWebResponse)
            {
                if (response.StatusCode != HttpStatusCode.OK)
                {
                    throw new Exception("Url returns " + response.StatusCode + ", " + response.StatusDescription);
                }
 
                StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.GetEncoding("gb2312"));
 
                try
                {
                    html = reader.ReadToEnd();
                }
                catch (Exception ex)
                {
                    throw ex;
                }
            }
            return html;
        }

  

 

posted @   Homegu  阅读(476)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
你的浏览器不支持canvasr
点击右上角即可分享
微信分享提示