正则字符集大全

正则式\p{名字}
正则字符集大全1,微软给出的,注意不全,补充在下面,但仍然不全,还有几个小区间找不到:

字符区间中文名
0000-007F是基本拉丁
0080-00FF是拉丁补充
0100-017F是拉丁扩展1
0180-024F是拉丁扩展2
0250-02AF是音标扩展
02B0-02FF是空格修改器字母
0300-036F是组合区分标记
0370-03FF是希腊/是希腊和科普特
0400-04FF是西里尔
0500-052F是西里尔补充
0530-058F是亚美尼亚
0590-05FF是希伯来语
0600-06FF是阿拉伯
0700-074F是叙利亚
0780-07BF是塔纳
0900-097F是梵文
0980-09FF是孟加拉语
0A00-0A7F是锡克教文
0A80-0AFF是吉吉拉特
0B00-0B7F是奥利亚
0B80-0BFF是泰米尔
0C00-0C7F是泰卢固
0C80-0CFF是加拿大
0D00-0D7F是马拉亚兰
0D80-0DFF是锡兰文
0E00-0E7F是泰国
0E80-0EFF是老挝
0F00-0FFF是西藏
1000-109F是缅甸
10A0-10FF是乔治亚
1100-11FF是朝鲜文
1200-137F是埃塞俄比亚
13A0-13FF是切诺基
1400-167F是统一加拿大土著语音节
1680-169F是欧甘
16A0-16FF是北欧
1700-171F是菲律宾
1720-173F是哈奴奴
1740-175F是布迪文
1760-177F是泰格班瓦
1780-17FF是柬埔寨
1800-18AF是蒙古
1900-194F是林布
1950-197F是泰勒
19E0-19FF是柬埔寨符号
1D00-1D7F是语音扩展
1E00-1EFF是拉丁附加扩展
1F00-1FFF是希腊扩展
2000-206F是一般标点
2070-209F是上下标
20A0-20CF是货币符号
20D0-20FF是符号组合区分标记/是符号组合标记
2100-214F是字母类符号
2150-218F是数字形式
2190-21FF是箭头
2200-22FF是数学运算符
2300-23FF是杂项工业技术
2400-243F是控制图片
2440-245F是可选特征识别
2460-24FF是闭式字母数字
2500-257F是盒画
2580-259F是块元素
25A0-25FF是几何形状
2600-26FF是杂项符号
2700-27BF是印刷
27C0-27EF是杂项数学符1
27F0-27FF是追加箭头1
2800-28FF是盲文模式
2900-297F是追加箭头2
2980-29FF是杂项数学符2
2A00-2AFF是补充数学操作符
2B00-2BFF是杂项符号箭头
2E80-2EFF是中日韩部首补充
2F00-2FDF是康熙部首
2FF0-2FFF是表意描述字符
3000-303F是中日韩符号标点
3040-309F是平假名
30A0-30FF是片假名
3100-312F是汉语拼音
3130-318F是兼容朝鲜文
3190-319F是象形
31A0-31BF是汉语拼音扩展
31F0-31FF是平假名音标扩展
3200-32FF是闭式中日韩字母和月份
3300-33FF是兼容中日韩
3400-4DBF是中日韩统一象形文字扩展1
4DC0-4DFF是易经六十四卦符号
4E00-9FFF是中日韩统一象形文字
A000-A48F是彝文音节
A490-A4CF是彝文部首
AC00-D7AF是韩文音节
D800-DB7F是高替代
DB80-DBFF是高自用替代
DC00-DFFF是低替代
E000-F8FF是自用/是自用区域
F900-FAFF是兼容中日韩象形文字
FB00-FB4F是字母表示
FB50-FDFF是阿拉伯表示1
FE00-FE0F是变量选择器
FE20-FE2F是组合半标记
FE30-FE4F是兼容中日韩形式
FE50-FE6F是小型变体
FE70-FEFF是阿拉伯表示2
FF00-FFEF是半或全宽形式
FFF0-FFFF是特殊

补充在此,还缺少几个:

字符区间中英文
0750-077F阿拉伯文补充(ArabicSupplement)
0780-07BF马尔代夫语(Thaana)
07C0-07FF西非书面语言
---------分界
0800-085F阿维斯塔语及巴列维语(AvestanandPahlavi)
0860-087F曼达语(Mandaic)
0880-08AF撒马利亚语(Samaritan)
--------分界
08b0-08fF**缺少**
1380-139F埃塞俄比亚语补充(EthiopicSupplement)
----分界
18B0-18FF可汗语(Cham)
-----分界
1980-19DF新泰语(NewTaiLue)
----分界
1A00-1A1F布吉语(Buginese)
1A20-1A5F巴达克(Batak)
1a60-1a7f*缺少*
1A80-1AEF兰纳(Lanna)
1af0-1aff*缺少*
1B00-1B7F巴厘语(Balinese)
1B80-1BB0巽他语(Sundanese)
1bb1-1bbf*缺少*
1BC0-1BFF帕苗语(PahawhHmong)
1C00-1C4F雷布查语(Lepcha)
1C50-1C7F桑塔利(OlChiki)
1C80-1CDF曼尼普尔语(Meithei/Manipuri)
1Ce0-1Cff*缺少*
-----分界
1D80-1DBF语音学扩展补充
1DC0-1DFF结合用读音符号补充(CombiningDiacriticsMarksSupplement)
----分界
2C00-2C5F格拉哥里字母(Glagolitic)
2C60-2C7F拉丁文扩展3(LatinExtended-C)
2C80-2CFF古埃及语(Coptic)
2D00-2D2F格鲁吉亚语补充(GeorgianSupplement)
2D30-2D7F提非纳文(Tifinagh)
2D80-2DDF埃塞俄比亚语扩展(EthiopicExtended)
2E00-2E7F追加标点(SupplementalPunctuation)
----分界
2Fe0-2Fef这一部分也是部首(*缺少*)
----分界
31C0-31EF中日韩笔画(CJKStrokes)
----分界
A500-A61F瓦伊(Vai)
A660-A6FF统一加拿大土著语音节补充(UnifiedCanadianAboriginalSyllabicsSupplement)
A700-A71F声调修饰字母(ModifierToneLetters)
A720-A7FF拉丁文扩展4(LatinExtended-D)
A800-A82F赛诺提(SylotiNagri)
A840-A87F八思巴字(Phags-pa)
A880-A8DF索拉什拉(Saurashtra)
A900-A97F爪哇语(Javanese)
A980-A9DF查克马(Chakma)
AA00-AA3F瓦朗什提(VarangKshiti)
AA40-AA6F索朗彭(SorangSompeng)
AA80-AADF新瓦里(Newari)
AB00-AB5F越泰语
AB80-ABA0克耶文(KayahLi)
aba1-abff(*缺少*)
-----分界
posted @   zjh6  阅读(22)  评论(0编辑  收藏  举报  
编辑推荐:
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 25岁的心里话
· 按钮权限的设计及实现
点击右上角即可分享
微信分享提示