黄聪

论SEO对人类的重要性,请看我的博客:hcsem.com

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

2013年3月26日

摘要: 转载来自:http://hcsem.com/2095/我来讲一下字符问题我的理解吧,虽然我对Python的编码处理的具体细节还不太清楚,不过临时稍微看了一下,和Perl的原理也差不多 最重要的是必须区分“字符”和“字节”的不同,“字符”是抽象的,而“字节”是具体的 比如一个“中”字,在不同编码中用如下字节表示: GBKBig5UTF-8 UTF-16LE \xD6\xD0\xA4\xA4\xE4\xB8\xAD\x2D\x4E 所谓“抽象”的“字符”的“中”,并不是指“\xD6\xD0”或“\xA4\xA4”或任何字节,应该把它理解成:GBK编码中“\xD6\xD0”字节所指代的那个字... 阅读全文
posted @ 2013-03-26 10:17 黄聪 阅读(3873) 评论(2) 推荐(1) 编辑

摘要: 文件编码是UTF-8,同时在文件头添加 # -*- coding: utf-8 -*-文件中所有的字符串前都加u,如 u"中文"在输入(抓取某些utf-8/gbk的网页)、输出(输出到网页、终端)的时候,要记住python内部是用Unicode存储的所有输入要先decode,变成unicode,输出时要encode变成想要的编码(MacOS X/Linux下输出为utf-8,Windows下输出为gbk,但如果是在pycharm自己的控制台下的话,windows下输出为utf-8也可以正常显示)还有其他很多种古老的解决方案,比如统一用gbk,比如中转编码不用unicode, 阅读全文
posted @ 2013-03-26 10:15 黄聪 阅读(9578) 评论(1) 推荐(0) 编辑

摘要: 1、应用程序(比如PHP)长时间的执行批量的MYSQL语句。最常见的就是采集或者新旧数据转化。解决方案:在my.ini文件中添加或者修改以下两个变量:wait_timeout=2880000interactive_timeout = 2880000关于两个变量的具体说明可以google或者看官方手册。如果不能修改my.cnf,则可以在连接数据库的时候设置CLIENT_INTERACTIVE,比如:sql = "set interactive_timeout=24*3600";mysql_real_query(...)2、执行一个SQL,但SQL语句过大或者语句中含有BLOB 阅读全文
posted @ 2013-03-26 02:14 黄聪 阅读(29695) 评论(1) 推荐(3) 编辑