应有以下两点认识:
1.unicode everywhere
2.读文件要与写文件时统一编码格式,即怎么写就怎么读,读出来之后就是unicode,就可以自己定义编码格式进行写入文件
3.常用gb2321<gbk,utf-8,由于带有中文字符的编码向后兼容,用gbk即可
给女友做作业给卡在这了。。。这还是我一年前学过的东西。。
接着todo爬虫编码吧