python学习笔记系列----(一)python简介
一个月前,就按下决心要系统的学习下python了,虽然之前有学习过java,学习过c++,也能较为熟练的使用java做自动化测试看懂c++里的业务逻辑,但是实际上有那么多的东西自己还是不清楚,今天下定决心,开始了python的系统的学习之路,之前我是有看过廖学峰的教程的,看完收获确实也是少,但总感觉就是少了什么,后面想了下,我想应该是自己的学习方法~~~介于之前学习RF的经验,我认为看官方文档对于一个想系统学习python的人来说,真的是一个不能再好的学习方法,接下来我会开始坚持把python2.7.11的学习笔记记录在此。
今天学习了python官网的第三章,python的非正式介绍,实际也还是有点收获的~~~https://docs.python.org/2/tutorial/introduction.html
1.1 使用 python 作计算器
安装好python后,在DOS窗口下,输入python,进入python的交互模式后,就可以使用python做一个计算器了(还挺强大呢~~)
>>> 2 + 2 4 >>> 50 - 5*6 20 >>> (50 - 5.0*6) / 4 5.0 >>> 8 / 5.0 1.6 >>> 2 ** 7 # 2 to the power of 7 128
上面这类简单的操作,之前我大概我也是有所了解,但是有2点需要注意下:
第一:除法 / 操作:除法后的数据类型是由操作数决定的,如果都是int类型的数据进行除法操作,采用的是除法是 floor division得到的就是int的返回值;如果有一个操作数是float类型的,采用的是classic division得到的就是float类型的。比如:
>>> 17 / 3 # int / int -> int 5 >>> 17 / 3.0 # int / float -> float 5.666666666666667
第二:除法 // 操作:除法后的数据类型也是由操作数决定的,采用的是floor division。一般取商就使用 “//”
第三:最后一个表达式可以_用下划线替代.这个特点让python做为一个计算器就更好使用。
>>> tax = 12.5 / 100 >>> price = 100.50 >>> price * tax 12.5625 >>> price + _ 113.0625 >>> round(_, 2) 113.06
1.2 Strings
String对象是用单引号或者双引号包围的,如下是经常见到的模式:
>>> 'spam eggs' # single quotes 'spam eggs' >>> 'doesn\'t' # use \' to escape the single quote... "doesn't" >>> "doesn't" # ...or use double quotes instead "doesn't"
还有String对象常用的一些操作简介,比如:字符串的拼接,根据字符串的index(整数,或者负数)取单个字符,对字符串进行切片操作取子字符串,字符串的不可变特性,字符串的操作(重复操作符:*,拼接操作符:+,但是不适合string类型的变量)。
A. 当字符串内的字符非转义字符时,怎么处理呢?比如
>>> print 'C:\some\name' 会打印出什么结果呢? 那肯定是
C:\some
ame
显然\n变成了换行符号了,但是实际作者的愿意不是这样的,在字符串前加上r实际就能解决问题了
>>> print r'C:\some\name'
C:\some\name
B. 需要打印多行的又漂亮的字符串怎么表达呢?
a = 1 b = 2 str ='loleina' print 'a is %d \nb is %d\nc is %s'%(a,b,str) print ''' a is %d b is %d c is %s '''%(a,b,str)
上面有2种方式,一种是一行表达,在需要换行的地方用\n换行,第二种就是使用'''...'''格式来显示多行的问题,这样增加了代码的可读性。
1.3 Unicode Strings (仅python2系列)
从python2.0开始,就有一种新的数据类型 Unicode Strings,但是在python3的到来,这个概念已经被弱化了。python2.*的默认编码格式是ASCII码,而python3.*的默认编码格式已经换成了Unicode,所以2.*还是有必要提一下。在python2系列中,如果要操作非ASCII码的字符,就可以用这个对象进行操作。它可以跟strings进行任意的转换。比如,现在有一个字符串变量s,保存中文字符"测试",现在直接打印是会报错的,因为存在一个非ASCII码的字符,python2.*是无法进行解析的,如果在上面加个u,就能正常显示(在集成开发工具内,设置集成工具和工程的默认编码为utf-8)
# -*- coding: gbk -*-if __name__=="__main__": s1 = '测试' #s1 = s1.decode('gbk') s1 = unicode(s1,'gbk') print s1
如上代码段在JetBrains PyCharm 2016.1.2内,使用2.7.11做解释器,做了一个小测试~~
1. 不设置源文件编码格式,输入中文,后直接打印,会提示存在‘non-ascii’,编译不通过
2. 设置源文件编码格式为gbk,输入中文后,打印乱码
3. 设置源文件编码格式为gbk,输入中文s1 = u'测试'后,打印正常
4. 设置源文件编码格式为gbk,输入中文后,先将字符串解码decode或者unicode方法,后打印正常
5. 设置源文件编码格式为utf-8,输入中文后直接输出正常
6. 设置工具和工程的默认编码为gbk,输入中文后,打印正常。
然后有点明白了~~在python2系列的IDE中声明一个非ASCII码的字符串,不声明源文件的编码格式,编译是不通过的,因为源文件python2的解析器尝试使用默认的ASCII码去编译,却发现存在非ASCII码的字符串;如果在此基础上设置源文件的编码格式为gbk,编译是可以通过了,但是打印出来的字符串是乱码的,为啥乱码呢?因为IDE是采用utf-8的编码格式,而源文件是采用gbk格式,所以会出现中文乱码现象,单纯的解决乱码有3种可行方式,一个方法是:将源文件里需要打印的字符串解码成utf-8(或者unicode)再打印;另一个方法是:修改源文件的编码格式直接为utf-8,最后一种是:修改IDE编码格式为gbk;显然第二种方法是最佳方法。
对于还不明白,神马是编码格式,ASCII码,Unicode,utf-8,GBK,GB2312,这些都编码格式之间的练习和区别是什么,我推荐可以看下廖学峰2.7教程下的字符串和编码这篇文章,看完之后应该是会有所收获的。这一章的主要内容就是以上部分啦,未完待续~~