代码改变世界

python文本去除表情符

2020-03-31 23:35  默默不语  阅读(2040)  评论(0编辑  收藏  举报
comment = “物流很快,昨晚下的单今天下午就到了👍个人觉得特别百搭的一个颜色。”

str不具有decode属性,必须先将其转换为bytes,转化为bytes要制定其编码,然后将其utf8解码,然后再编码成gbk,同时备注‘ignore’属性,忽视无法编码的emoji,最后解码然后转换成str,便可输出到txt。

把其转化为gbk(方便txt保存)的编码格式,同时去除👍。

comment = str(bytes(comment, encoding='utf-8').decode('utf-8').encode('gbk', 'ignore').decode('gbk'))