python3 表情符号转义,特殊符号转义,过滤四字节字符 表情字符
普通的转义不说了,简单的转义即可
今天碰到了表情付哈入库,很烦,发现一个第三方库,很简单即可将表情字符删除
emoji官网,https://pypi.org/project/emoji/(靠谱的emoji处理库)
安装 pip install emoji
清除命令:
emoji.demojize(str)
完整代码:
import emoji,re st = 'Best Seller 🔥64PCS(Save $ 50 🔥Free Shipping)😊' emoji_str = emoji.demojize(st) name = re.sub(r':(.*?):','',emoji_str).strip() #清洗后的数据 print(name)
拓展延伸:
正则表达式里面 .* 和 .*? 有什么区别?
答:表达式 .* 就是单个字符匹配任意次,即贪婪匹配。 表达式 .*? 是满足条件的情况只匹配一次,即最小匹配.