C# 正则表达式 —— 中文/英文空格(全角/半角空格)处理

1. 匹配中文(全角)空格

Regex.IsMatch(" ", "\u3000");

\u3000是全角空格的16进制Unicode编码。

2. 匹配英文(半角)空格

Regex.IsMatch(" ", "\u0020")

\u0020是半角空格的16进制Unicode编码。

3. 去除中文字符之间的英文(半角)空格

string text = "<p> 测 试 test1. 一下</p>";
var result
= Regex.Replace(text, "(?<=[\u4e00-\u9fa5])(\u0020)(?=[\u4e00-\u9fa5])", string.Empty);
Console.WriteLine(result);
//结果是:<p> 测试 test1. 一下</p>

(?=[\u4e00-\u9fa5]) 表示“正向预搜索”一个中文字符,判断\u0020的右侧是否为中文字符。

(?<=[\u4e00-\u9fa5]) 表示“反向预搜索”一个中文字符,判断\u0020的左侧是否为中文字符。

4. 在中文字符与英文字符之间增加空格

string text = "<p> test测试test1. 一hello下</p>";            
text
= Regex.Replace(text, @"(?<=[\u4e00-\u9fa5])([a-zA-Z])(?=[a-zA-Z])", " $1");
text
= Regex.Replace(text, @"(?<=[a-zA-Z])([a-zA-Z])(?=[\u4e00-\u9fa5])", "$1 ");
Console.WriteLine(text);
//输出结果:<p> test 测试 test1. 一 hello 下</p>

第一个正则表达式是针对“左中文,右英文”的情况。

第二个正则表达式是针对“左英文,右中文”的情况。

posted @   dudu  阅读(27219)  评论(2编辑  收藏  举报
编辑推荐:
· 一个奇形怪状的面试题:Bean中的CHM要不要加volatile?
· [.NET]调用本地 Deepseek 模型
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· .NET Core 托管堆内存泄露/CPU异常的常见思路
· PostgreSQL 和 SQL Server 在统计信息维护中的关键差异
阅读排行:
· DeepSeek “源神”启动!「GitHub 热点速览」
· 我与微信审核的“相爱相杀”看个人小程序副业
· 微软正式发布.NET 10 Preview 1:开启下一代开发框架新篇章
· C# 集成 DeepSeek 模型实现 AI 私有化(本地部署与 API 调用教程)
· spring官宣接入deepseek,真的太香了~
历史上的今天:
2004-09-17 [功能改进]增强的留言簿功能
2004-09-17 [重要新功能]留言簿
点击右上角即可分享
微信分享提示