python,去掉“xa0”和“\r\n”

爬小说网站,输出内容有时候会出现下图字符

 

 首先,去掉“xa0”

s = 'T-shirt\xa0\xa0短袖圆领衫,体恤衫\xa0'
out = "".join(s.split())
print(out)

 

 然后,去掉“\r\n”

s = 'T-shirt,\r\n'
s = s.strip()
print(s)

 

posted @ 2021-01-17 15:03  小贝书屋  阅读(967)  评论(0编辑  收藏  举报