爬小说网站,输出内容有时候会出现下图字符
首先,去掉“xa0”
s = 'T-shirt\xa0\xa0短袖圆领衫,体恤衫\xa0' out = "".join(s.split()) print(out)
然后,去掉“\r\n”
s = 'T-shirt,\r\n' s = s.strip() print(s)