Visual Studio 2015的坑:中文字符串编译后成乱码

(2015年8月5日更新:微软已经修复了Roslyn的这个bug,详见 https://github.com/dotnet/roslyn/pull/4303

昨天,我们用VS2015编译了博客程序中的一个程序集并发布上线。

今天有园友反馈向我们反馈,个人博客分页显示随笔列表的页面中,“上一页”“下一页”显示乱码:

而这个地方的“上一页”“下一页”字符串恰恰是在我们昨天发布的程序集中定义的:

public class Pager : Control
{
    protected string PreviousText = "上一页";
    protected string NextText = "下一页";

    //...
}

可是昨天我们并没有更改这部分代码,肯定不是我们昨天代码修改引起的。

于是,我们改用VS2013重新编译了一下这个程序集,更新之后,乱码立马消失。

接着,用ILSpy反编译了VS2015所编译出的程序集的IL代码之后,真相大白:

public class Pager : Control
{
    protected string PreviousText = "ÉÏÒ»Ò³";
    protected string NextText = "ÏÂÒ»Ò³";
    //...
}

原来是VS2015所用的编译器惹的祸,而这个编译器就是大名鼎鼎的 Roslyn

大家使用 Visual Studio 2015 时需要注意一下这个问题。

【补充】

用ildasm查看VS2015编译出来的程序集的IL代码(乱码):

.maxstack  2
IL_0000:  ldarg.0
IL_0001:  ldstr      bytearray (C9 00 CF 00 D2 00 BB 00 D2 00 B3 00 ) 
IL_0006:  stfld      string BlogServer.Web.Controls.Pager::PreviousText
IL_000b:  ldarg.0
IL_000c:  ldstr      bytearray (CF 00 C2 00 D2 00 BB 00 D2 00 B3 00 ) 
IL_0011:  stfld      string BlogServer.Web.Controls.Pager::NextText

用ildasm查看VS2013编译出来的程序集的IL代码(未乱码):

.maxstack  2
IL_0000:  ldarg.0
IL_0001:  ldstr      bytearray (0A 4E 00 4E 75 98 )                               // .N.Nu.
IL_0006:  stfld      string BlogServer.Web.Controls.Pager::PreviousText
IL_000b:  ldarg.0
IL_000c:  ldstr      bytearray (0B 4E 00 4E 75 98 )                               // .N.Nu.
IL_0011:  stfld      string BlogServer.Web.Controls.Pager::NextText

【问题原因与临时解决方法】

在GitHub上提交Issue之后,从回复中得知这个问题与Roslyn检测文件编码的处理方式有关。

查看出现乱码问题的.cs文件编码,发现用的是ANSI编码。于是以UTF-8编码另存该文件,然后用VS2015重新编译,问题解决。

VS2015 RC中没这个问题。

【GitHub上的相关链接】

* VS2015打开非unicode编码的代码,其中变量名有中文就无法编译的bug

* .NET compiler produces incorrect string constants in MSIL when C# source files encoded with non-UTF-8 encoding

* VS2015 (MSBuild/14) compiler can't detect file ecoding correctly

* Chinese string is compiled to garbage characters

* Roslyn can't detect 932 encoding

posted @   博客园团队  阅读(53466)  评论(54编辑  收藏  举报
编辑推荐:
· .NET Core 托管堆内存泄露/CPU异常的常见思路
· PostgreSQL 和 SQL Server 在统计信息维护中的关键差异
· C++代码改造为UTF-8编码问题的总结
· DeepSeek 解答了困扰我五年的技术问题
· 为什么说在企业级应用开发中,后端往往是效率杀手?
阅读排行:
· 2分钟学会 DeepSeek API,竟然比官方更好用!
· .NET 使用 DeepSeek R1 开发智能 AI 客户端
· autohue.js:让你的图片和背景融为一体,绝了!
· 10亿数据,如何做迁移?
· 推荐几款开源且免费的 .NET MAUI 组件库
历史上的今天:
2013-07-31 云计算之路:AWS, Azure, Aliyun, UCloud提供的Windows操作系统
2009-07-31 博客园新版首页上线测试,您喜欢吗?
点击右上角即可分享
微信分享提示