09 2012 档案
摘要:当重复一个正则表达式时,如用 a*,操作结果是尽可能多地匹配模式。当你试着匹配一对对称的定界符,如 HTML 标志中的尖括号。匹配单个 HTML 标志的模式不能正常工作,因为 .* 的本质是“贪婪”的>>> s = '<html><head><title>Title</title>'>>> len(s)32>>> print re.match('<.*>', s).span()(0, 32)>>> print re.match(&#
阅读全文
摘要:相信很多pythoner都对python 3.0之前版本的编码问题恨之入骨,我也对这个问题恨到基因里面。有时候也真的想放弃这个3.0之前的版本,直接奔3.0,不仅是因为3.0之前的版本编码问题,还有它不支持多核计算。但3.0也有很多缺憾,就是库类跟不上。没办法,只能硬着头皮跟它干。 使用python一年多后,也总结了一些解决编码的方法。 1、乱码的编码 因为乱码基本上都不能用任何一种编码方式(“utf-8,gb18030”)去编码或解码,或者能utf-8编码,但不能gb18030编码;或者反过来。可程序要运行流畅怎么办?我想出了一套办法。 查了一下ASCII码表,发现ASCII...
阅读全文
摘要:我们知道,MongoDB的索引是B-Tree结构的,和MySQL的索引非常类似。所以你应该听过这样的建议:创建索引的时候要考虑到sort操作,尽量把sort操作要用到的字段放到你的索引后面。但是有的情况下,这样做反而会使你的查询性能更低。问题比如我们进行下面这样的查询:db.collection.find({"country": "A"}).sort({"carsOwned": 1})查询条件是{“country”: “A”},按 carsOwned 字段的正序排序。所以索引就很好建了,直接建立 country , carsOwned
阅读全文