使用实例:
htmlsourse=unicode(urllib.urlopen(url).read(),"gb2312","ignore").encode("utf-8","ignore") # 先转为 unicode 码 再进行 utf-8 编码