Python 过滤HTML实体符号简易方法
html_tag = {'
': '\n', '"': '\"', '&': '', '<': '<', '>': '>',
''': "'", ' ': ' ', '¥': '¥', '©': '©', '÷': '÷'
, '×': 'x', '™': '™', '®': '®', '§': '§', '€': '€',
'£': '£', '¢': '¢', '»': '»'
}
for k, v in html_tag.items():
str = str.replace(k, v)
str = str.replace(k[1:], v)
# str就是要过滤的字符串