2014 年 3月 30 日随笔档案 - yycGIS

python编码（四）

摘要：一、预备知识字符集1，常用字符集分类ASCII及其扩展字符集作用：表语英语及西欧语言。位数：ASCII是用7位表示的，能表示128个字符；其扩展使用8位表示，表示256个字符。范围：ASCII从00到7F，扩展从00到FF。ISO-8859-1字符集作用：扩展ASCII，表示西欧、希腊语等。位数：8位，范围：从00到FF，兼容ASCII字符集。GB2312字符集作用：国家简体中文字符集，兼容ASCII。位数：使用2个字节表示，能表示7445个符号，包括6763个汉字，几乎覆盖所有高频率汉字。范围：高字节从A1到F7, 低字节从A1到FE。将高字节和低字节分别加上0XA0即可得到编码。BIG5 阅读全文

posted @ 2014-03-30 22:47 yycGIS 阅读(472) 评论(0) 推荐(0) 编辑

python编码（三）

摘要： python 有str object 和 unicode object 两种字符串，都可以存放字符的字节编码，但是他们是不同的type，这一点很重要，也是为什么会有encode（编码）和decode（解码）。encode 和 decode在pyhton中的意义可表示为： encode unicode -------------------------> str unicode >> t='长城'2 >>> t3 '\xb3\xa4\xb3\xc7'4 >>> t.decode('gb2312' 阅读全文

posted @ 2014-03-30 21:54 yycGIS 阅读(314) 评论(0) 推荐(0) 编辑

python编码（二）

摘要：谈谈Unicode编码，简要解释UCS、UTF、BMP、BOM等名词问题一使用Windows记事本的“另存为”，可以在GBK、Unicode、Unicode big endian和UTF-8这几种编码方式间相互转换。同样是txt文件，Windows是怎样识别编码方式的呢？我很早前就发现Unicode、Unicode big endian和UTF-8编码的txt文件的开头会多出几个字节，分别是FF、FE（Unicode）,FE、FF（Unicode big endian）,EF、BB、BF（UTF-8）。但这些标记是基于什么标准呢？问题二最近在网上看到一个 ConvertUTF.c，实现了UTF 阅读全文

posted @ 2014-03-30 19:34 yycGIS 阅读(323) 评论(0) 推荐(0) 编辑

python编码（一）

摘要：下面介绍一下python的编码机制，unicode, utf-8, utf-16, GBK, GB2312,ISO-8859-1等编码之间的转换。1.自动识别字符串编码：#coding:utf8#chartdet官方下载网站：http://pypi.python.org/pypi/chardetimport urllibimport chardetrawdata = urllib.urlopen('http://www.google.cn/').read()print chardet.detect(rawdata)输出：#confidence是可信度，encoding是编码{& 阅读全文

posted @ 2014-03-30 19:22 yycGIS 阅读(838) 评论(0) 推荐(0) 编辑

删除重复的feature vba VS 删除重复的feature python

摘要： VBA： 1 Sub deleteDuplicatedFeature() 2 3 Dim app As IApplication 4 Set app = Application 5 6 Dim pMxDocument As IMxDocument 7 Set pMxDocument = Application.Document 8 9 Dim pMap As IMap10 Set pMap = pMxDocument.FocusMap11 12 Dim pFeatureLayer As IFeatureLayer13 Set pFeatureLayer = pMap.Layer(0)14... 阅读全文

posted @ 2014-03-30 17:58 yycGIS 阅读(381) 评论(0) 推荐(0) 编辑

新浪微博mid和url的互算

摘要：我们在使用新浪微博API时，有时需要得到一个微博的url，但是如statuses/public_timeline等接口中取得的微博status的字段中并没有包含。不过，status中包含了一个mid字段，通过mid，我们实际上是可以通过计算得到url的。在开始计算之前有必要说明一下，什么是base62编码。它实际上就是十进制和62位进制的互换。对于62进制，从0数到9以后，10用小写字母a表示，接着数完26个字母，到z为35，然后36为大写字母A，一直到61为大写字母Z。所以，我们可以实现十进制数字base62编码的encode和decode。下面的代码实际上来自stackoverflow：阅读全文

posted @ 2014-03-30 17:52 yycGIS 阅读(1709) 评论(0) 推荐(0) 编辑

用python实现各种排序算法

摘要：最简单的排序有三种：插入排序，选择排序和冒泡排序。它们的平均时间复杂度均为O(n^2)，在这里对原理就不加赘述了。贴出源代码：插入排序： 1 def insertion_sort(sort_list): 2 iter_len = len(sort_list) 3 if iter_len =0 and sort_list[j]>key: 9 sort_list[j+1] = sort_list[j]10 j =j - 111 sort_list[j+1] = key12 return sort_list冒泡排... 阅读全文

posted @ 2014-03-30 16:58 yycGIS 阅读(515) 评论(0) 推荐(0) 编辑

Python中的replace方法

摘要： replace 方法：返回根据正则表达式进行文字替换后的字符串的复制。stringObj.replace(rgExp, replaceText)参数stringObj必选项。要执行该替换的 String 对象或字符串文字。该字符串不会被 replace 方法修改。rgExp必选项。为包含正则表达式模式或可用标志的正则表达式对象。也可以是 String 对象或文字。如果 rgExp 不是正则表达式对象，它将被转换为字符串，并进行精确的查找；不要尝试将字符串转化为正则表达式。replaceText必选项。是一个String 对象或字符串文字，对于stringObj 中每个匹配 rgExp 中的位置阅读全文

posted @ 2014-03-30 10:41 yycGIS 阅读(10275) 评论(0) 推荐(0) 编辑

yycGIS

导航

公告