C#字符串Unicode转义序列编解码
在开发过程中时常会遇到"\Uxxxx"格式表示的字符,实际上"xxxx"是字符的Unicode码的十六进制表示方式。这种表示称为"Unicode转义字符"。
例如"A"对应的Unicode码为65(十进制),转换后为"\U0041"。
以下C#封装的两个扩展函数,可以对Unicode字符串文本进行转义编码以及从转义序列解码。
1.解码:
public static string UnescapeUnicode(this string str) // 将unicode转义序列(\uxxxx)解码为字符串
{
return (System.Text.RegularExpressions.Regex.Unescape(str));
}
2.编码:
public static string EscapeUnicode(this string str) // 将字符串编码为unicode转义序列(\uxxxx)
{
StringBuilder tmp = new StringBuilder();
for (int i = 0; i < str.Length; i++)
{
ushort uxc = (ushort)str[i];
tmp.Append(@"\u" + uxc.ToString("x4"));
}
return (tmp.ToString());
}
参考:
https://blog.csdn.net/zcr_59186/
知乎: @张赐荣
赐荣博客: www.prc.cx
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 微软正式发布.NET 10 Preview 1:开启下一代开发框架新篇章
· 没有源码,如何修改代码逻辑?
· PowerShell开发游戏 · 打蜜蜂
· 在鹅厂做java开发是什么体验
· WPF到Web的无缝过渡:英雄联盟客户端的OpenSilver迁移实战