爬取微博存入数据库时出错
微博内容为utf-8编码,但是其中有部分特殊字符,无法存入数据库。先将其写入txt文件,再存入数据库,无错。证明存入txt过程中有转码操作。
用下面转码即可实现。
byte[] b = text.getBytes("utf-8");//编码
text = new String(b, "utf-8");
微博内容为utf-8编码,但是其中有部分特殊字符,无法存入数据库。先将其写入txt文件,再存入数据库,无错。证明存入txt过程中有转码操作。
用下面转码即可实现。
byte[] b = text.getBytes("utf-8");//编码
text = new String(b, "utf-8");