yycGIS

我们曾如此渴望命运的波澜,到最后才发现:人生最曼妙的风景,竟是内心的淡定与从容。 我们曾如此期盼外界的认可,到最后才知道:世界是自己的,与他人毫无关系。

Less is more, more is different!

导航

2014年3月30日 #

python编码(四)

摘要: 一、预备知识字符集1, 常用字符集分类ASCII及其扩展字符集作用:表语英语及西欧语言。位数:ASCII是用7位表示的,能表示128个字符;其扩展使用8位表示,表示256个字符。范围:ASCII从00到7F,扩展从00到FF。ISO-8859-1字符集作用:扩展ASCII,表示西欧、希腊语等。位数:8位,范围:从00到FF,兼容ASCII字符集。GB2312字符集作用:国家简体中文字符集,兼容ASCII。位数:使用2个字节表示,能表示7445个符号,包括6763个汉字,几乎覆盖所有高频率汉字。范围:高字节从A1到F7, 低字节从A1到FE。将高字节和低字节分别加上0XA0即可得到编码。BIG5 阅读全文

posted @ 2014-03-30 22:47 yycGIS 阅读(472) 评论(0) 推荐(0) 编辑

python编码(三)

摘要: python 有str object 和 unicode object 两种字符串,都可以存放字符的字节编码,但是他们是不同的type,这一点很重要,也是为什么会有encode(编码)和decode(解码)。encode 和 decode在pyhton中的意义可表示为: encode unicode -------------------------> str unicode >> t='长城'2 >>> t3 '\xb3\xa4\xb3\xc7'4 >>> t.decode('gb2312' 阅读全文

posted @ 2014-03-30 21:54 yycGIS 阅读(314) 评论(0) 推荐(0) 编辑

python编码(二)

摘要: 谈谈Unicode编码,简要解释UCS、UTF、BMP、BOM等名词问题一使用Windows记事本的“另存为”,可以在GBK、Unicode、Unicode big endian和UTF-8这几种编码方式间相互转换。同样是txt文件,Windows是怎样识别编码方式的呢?我很早前就发现Unicode、Unicode big endian和UTF-8编码的txt文件的开头会多出几个字节,分别是FF、FE(Unicode),FE、FF(Unicode big endian),EF、BB、BF(UTF-8)。但这些标记是基于什么标准呢?问题二最近在网上看到一个 ConvertUTF.c,实现了UTF 阅读全文

posted @ 2014-03-30 19:34 yycGIS 阅读(323) 评论(0) 推荐(0) 编辑

python编码(一)

摘要: 下面介绍一下python的编码机制,unicode, utf-8, utf-16, GBK, GB2312,ISO-8859-1等编码之间的转换。1.自动识别字符串编码:#coding:utf8#chartdet官方下载网站:http://pypi.python.org/pypi/chardetimport urllibimport chardetrawdata = urllib.urlopen('http://www.google.cn/').read()print chardet.detect(rawdata)输出:#confidence是可信度,encoding是编码{& 阅读全文

posted @ 2014-03-30 19:22 yycGIS 阅读(838) 评论(0) 推荐(0) 编辑

删除重复的feature vba VS 删除重复的feature python

摘要: VBA: 1 Sub deleteDuplicatedFeature() 2 3 Dim app As IApplication 4 Set app = Application 5 6 Dim pMxDocument As IMxDocument 7 Set pMxDocument = Application.Document 8 9 Dim pMap As IMap10 Set pMap = pMxDocument.FocusMap11 12 Dim pFeatureLayer As IFeatureLayer13 Set pFeatureLayer = pMap.Layer(0)14... 阅读全文

posted @ 2014-03-30 17:58 yycGIS 阅读(381) 评论(0) 推荐(0) 编辑

新浪微博mid和url的互算

摘要: 我们在使用新浪微博API时,有时需要得到一个微博的url,但是如statuses/public_timeline等接口中取得的微博status的字段中并没有包含。不过,status中包含了一个mid字段,通过mid,我们实际上是可以通过计算得到url的。在开始计算之前有必要说明一下,什么是base62编码。它实际上就是十进制和62位进制的互换。对于62进制,从0数到9以后,10用小写字母a表示,接着数完26个字母,到z为35,然后36为大写字母A,一直到61为大写字母Z。所以,我们可以实现十进制数字base62编码的encode和decode。下面的代码实际上来自stackoverflow: 阅读全文

posted @ 2014-03-30 17:52 yycGIS 阅读(1709) 评论(0) 推荐(0) 编辑

用python实现各种排序算法

摘要: 最简单的排序有三种:插入排序,选择排序和冒泡排序。它们的平均时间复杂度均为O(n^2),在这里对原理就不加赘述了。贴出源代码:插入排序: 1 def insertion_sort(sort_list): 2 iter_len = len(sort_list) 3 if iter_len =0 and sort_list[j]>key: 9 sort_list[j+1] = sort_list[j]10 j =j - 111 sort_list[j+1] = key12 return sort_list冒泡排... 阅读全文

posted @ 2014-03-30 16:58 yycGIS 阅读(515) 评论(0) 推荐(0) 编辑

Python中的replace方法

摘要: replace 方法:返回根据正则表达式进行文字替换后的字符串的复制。stringObj.replace(rgExp, replaceText)参数stringObj必选项。要执行该替换的 String 对象或字符串文字。该字符串不会被 replace 方法修改。rgExp必选项。为包含正则表达式模式或可用标志的正则表达式对象。也可以是 String 对象或文字。如果 rgExp 不是正则表达式对象,它将被转换为字符串,并进行精确的查找;不要尝试将字符串转化为正则表达式。replaceText必选项。是一个String 对象或字符串文字,对于stringObj 中每个匹配 rgExp 中的位置 阅读全文

posted @ 2014-03-30 10:41 yycGIS 阅读(10275) 评论(0) 推荐(0) 编辑