\u Unicode和汉字转化
介绍
\uxxxx这种格式是Unicode写法,表示一个字符,其中xxxx表示一个16进制数字,范围所0~65535. Unicode十六进制数只能包含数字0~9、大写字母A~F或者小写字母A~F。需要注意到是:Unicode的大小端问题,一般都是小端在前,例如 \u5c0f 表示汉语中的 '小'字,转换成10进制就是9215,所以在byte数组中应该是1592.
汉字转Unicode
private string Unicode2Chinese(string strUnicode) { string[] splitString = new string[1]; splitString[0] = "\\u"; string[] unicodeArray = strUnicode.Split(splitString, StringSplitOptions.RemoveEmptyEntries); StringBuilder sb = new StringBuilder(); foreach (string item in unicodeArray) { byte[] codes = new byte[2]; int code1, code2; code1 = Convert.ToInt32(item.Substring(0, 2), 16); code2 = Convert.ToInt32(item.Substring(2), 16); codes[0] = (byte)code2;//必须是小端在前 codes[1] = (byte)code1; sb.Append(Encoding.Unicode.GetString(codes)); } return sb.ToString(); }
Unicode转汉字
private string Chinese2Unicode(string strChinese) { string strUnicodes = string.Empty; foreach (char item in strChinese.ToCharArray()) { strUnicodes += "\\u" + ((int)item).ToString("x"); //16进制 } return strUnicodes; }
程序截图:
作者:樊勇
出处:http://www.cnblogs.com/fanyong/
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。
我的联系方式:fanyong@gmail.com
个人独立博客:www.fy98.com
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源!
· 周边上新:园子的第一款马克杯温暖上架
2011-06-26 【软件工程小知识】