PostGreSql判断字符串中含中⽂⽅法

⼀、采⽤正则表达式⽅法

主要基于数据库采⽤UTF-8和客户端也是⽤UTF-8的字符集⽅式⽣成的数据,这样可以结合中⽂字体库设定起⽌来筛选。

select id,name from ma_net where name ~ '[吖-座]';

说明:

~ 匹配,区分⼤⼩写 'jimi' ~ '.*jimi.*'

~* 匹配,不区分⼤⼩写 'jimi' ~* '.*JIMI.*'

结果如下:

⼆、采⽤编码范围搜索

u2e80-ua4cf

包含了中⽇朝部⾸补充、康熙部⾸、表意⽂字描述符、中⽇朝符号和标点、⽇⽂平假名、⽇⽂⽚假名、注⾳字母、谚⽂兼容字母、象形字注释标志、注⾳字母扩展、中⽇朝笔画、⽇⽂⽚假名语⾳扩展、带圈中⽇朝字母和⽉份、中⽇朝兼容、中⽇朝统⼀表意⽂字扩展A、易经六⼗四卦符号、中⽇韩统⼀表意⽂字、彝⽂⾳节、彝⽂字根

uf900-ufaff

中⽇朝兼容表意⽂字

ufe30-ufe4f

中⽇朝兼容形式

基于上述学习及分析,那么找字符串带中⽂的数据则可以⽤:

select id,name from ma_net_190723_2 where name ~ '[\u2e80-\ua4cf]|[\uf900-\ufaff]|[\ufe30-\ufe4f]';

上述两种⽅法是可以找到字符串含中⽂的字符,但如果在遇到只需要判断⾸字符是否是中⽂,则可以利⽤ascii码特点,将其转换成ascii码⼤于127的是⾮中⽂字符。

⽤SQL语句表⽰:select id,name from ma_net_190723_2 where ascii(name)>127;上述些⽅法,仅抛砖引⽟。

posted @ 2022-09-13 10:29  zhangzhiping35  阅读(195)  评论(0编辑  收藏  举报