PostgreSQL常用字符串分割函数整理记录
记录一下postgresql字符串切割处理的函数
1. SPLIT_PART
SPLIT_PART() 函数通过指定分隔符分割字符串,并返回第N个子串。语法:
SPLIT_PART(string, delimiter, position)
- string : 待分割的字符串
- delimiter:指定分割字符串
- position:返回第几个字串,从1开始,该参数必须是正数。如果参数值大于分割后字符串的数量,函数返回空串。
示例:SELECT SPLIT_PART('A,B,C', ',', 2); -- 返回B
2.STRING_TO_ARRAY
该函数用于分割字符串至数组元素,语法:
string_to_array(string, delimiter [, null string])
- string : 待分割的字符串
- delimiter:指定分割字符串
- null string : 设定空串的字符串
示例:
-
SELECT string_to_array('xx~^~yy~^~zz', '~^~'); -- {xx,yy,zz}
-
SELECT string_to_array('xx~^~yy~^~zz', '~^~', 'yy'); -- {xx,NULL,zz}
3. regexp_split_to_array|regexp_split_to_table
使用正则表达式分割字符串,用来将字符串转换成格式化数据,一个是转换成数组,一个是转换成结果集表,语法:
regexp_split_to_array ( string, pattern [, flags text ] ) → text[]
- string : 待分割的字符串
- pattern:正则表达式或指定分割字符串
示例1:正则表达式
SELECT regexp_split_to_array('foo bar baz', '\s+');
示例2:指定分割字符串
- SELECT * FROM student t WHERE regexp_split_to_array(t.subject,',') @> array['英语','中国古典文学']
- SELECT * FROM student t WHERE regexp_split_to_array(t.subject,',') @> regexp_split_to_array('英语','中国古典文学',',')
regexp_split_to_table ( string, pattern [, flags text ] )
- string : 待分割的字符串
- pattern:正则表达式或指定分割字符串
Tips:查询具体排序的第几个的用regexp_split_to_array函数,查询是否包含的条件,则使用ARRAY_AGG与 regexp_split_to_table两个函数
4.regexp_split_to_array
和上面一样,只是返回数据类型,语法:
regexp_split_to_array( string, pattern )
- string : 待分割的字符串
- pattern:正则表达式或指定分割字符串
示例1(单个切断):
select regexp_split_to_array('the,quick,brown;fox;jumps', '[,;]') -- 返回 {the,quick,brown,fox,jumps}
示例2(表字段和传入字符串比较):
select regexp_split_to_array(subjects,',') @> regexp_split_to_array('英语,中国古典文学',',')
@> 包含的关系,不指定顺序
subjects 包含 数据:'英语','中国古典文学'
= 相等的关系
subjects 等于 数据:'英语','中国古典文学'
!= 不等的关系
subjects 不等于 数据:'英语','中国古典文学'
&& 存在
subjects 包含 数据:'英语','中国古典文学' 其中的一条
5. regexp_matches
匹配一个POSIX正则表达式针对字符串并返回匹配的子字符串。语法:
REGEXP_MATCHES(string, pattern [, flags])
- string : 待分割的字符串
- pattern:要提取子字符串的字符串那匹配正则表达式
- flag:一个或多个控制函数行为的字符
- 返回结果:即使结果数组仅包含单个元素,函数也会返回一组文本
示例1(提取指定符号后的内容):
SELECT REGEXP_MATCHES('Learning #Geeksforgeeks #geekPower', '#([A-Za-z0-9_]+)', 'g');
示例2(可以通过正则表达式匹配的所有模式都一样):
SELECT REGEXP_MATCHES('ABC', '^(A)(..)$', 'g');