Python-03-基础

一、集合

集合(set)是一个无序的、不重复的元素组合，它的主要作用如下：

去重：把一个列表变成集合，就会自动去重。
关系测试：测试两组数据之前的交集、差集、并集等关系。

常用操作

# 创建数值集合
list_1 = set([1,2,3,4,5])
list_2 = set([5,6,7,8,9])
list_3 = set([1,2,3])

# 常用操作：
# 1.交集(两个集合相同的部分)
list_1.intersection(list_2)             # 方法1
list_1 & list_2                         # 方法2
# 2.并集(合并两个列表，并去重)
list_1.union(list_2)                    # 方法1
list_1 | list_2                         # 方法2
# 3.差集（list1中有list2中没有的部分）
list_1.difference(list_2)               # 方法1
list_1 - list_2                         # 方法2
# 4.对称差集(取出两个列表中互不相同的部分)
list_1.symmetric_difference(list_2)     # 方法1
list_1 ^ list_2                         # 方法2
# 5.子集
list_3.issubset(list_1)                 # 方法1
list_3 <= list_1                        # 方法2
# 6.父集
list_1.issuperset(list_3)               # 方法1
list_1 >= list_3                        # 方法2
# 7.是否有交集
list_3.isdisjoint(list_1)               # True or False

# 增删改查
# 1.添加
list_1.add('999')                # 添加1个元素
list_1.update([888,777,666])     # 添加多个元素
# 2.删除
list_1.remove('3')               # 从集合中移除一个元素，没有此元素时,raise KeyError
list_1.discard('4')              # 移除集合里的一个元素，如果给的参数不是集合里的元素，则什么都不做
list_1.pop()                     # 随机删除并显示已删除的项
list_1.clear()                   # 移除集合内的所有元素
# 3.浅复制
list_1.copy()                    # 返回list_1的一个浅复制
# 4.包含
1 in list_1                      # 测试1是否是list_1的成员
9 not in list_1                  # 测试9是否不是list_1的成员
# 其他
len(list_1)                      # list_1的长度

二、编码转换

想了解更详细请点击这里

Python3中的编码转换

Python3中默认是Unicode编码

#!/usr/bin/env python
#-*- coding:utf-8 -*-

name = "周杰伦"
# 转为UTF-8编码
print(name.encode('UTF-8'))
# 转为GBK编码
print(name.encode('GBK'))
# 转为GB2312
print(name.encode('GB2312'))

Python2中的编码转换

因为在python2.X中默认是ASCII编码，你在文件中指定编码为UTF-8，但是UTF-8如果你想转GBK的话是不能直接转的，的需要Unicode做一个转接站点。

#!/usr/bin/env python
#-*- coding:utf-8 -*-

import sys
print(sys.getdefaultencoding())

msg = "周杰伦"
msg_gb2312 = msg.decode("utf-8").encode("gb2312")
gb2312_to_gbk = msg_gb2312.decode("gbk").encode("gbk")

print(msg)
print(msg_gb2312)
print(gb2312_to_gbk)

三、文件操作

对文件操作的流程：

打开文件，得到文件句柄并赋值给一个变量
通过句柄对文件进行操作
关闭文件

文件句柄 = open('文件路径', '打开模式')

打开文件的模式有：

r，只读模式（默认）。

w，只写模式。【不可读；不存在则创建；存在则删除内容；】

a，追加模式。【可读；不存在则创建；存在则只追加内容；】

"+" 表示可以同时读写某个文件

r+，可读写文件。【可读；可写；可追加】

w+，写读

a+，同a

"U"表示在读取时，可以将 \r \n \r\n自动转换成 \n （与 r 或 r+ 模式同使用）**

rU

r+U

"b"表示处理二进制文件(如：FTP发送上传ISO镜像文件，linux可忽略，windows处理二进制文件时需标注)

rb

wb

ab

open文件操作演示

f = open('data.txt', 'r', encoding='utf-8')
print(f.tell())
# 按照字符读
f.read(2)
# tell()返回的是根据字节得到的位置
print(f.tell())
# seek()指定当前指针位置，seek()用的是字节
# 由于有中文，所以把指针指向1，就会报错，因为一个中文包括三个字节
# f.seek(1)
# print(f.read())

# truncate():把当前指针位置之前的数据保留下来，舍去后面的（需用a+模式）
f.close()

with语句

为了避免打开文件后忘记关闭，可以通过管理上下文，即：

with open('data','r') as f:
    ...

如此方式，当with代码块执行完毕时，内部会自动关闭并释放文件资源。
在Python 2.7 后，with又支持同时对多个文件的上下文进行管理，即：

with open('data1') as obj1, open('data2') as obj2:

    pass

四、函数

函数是指将一组语句的集合通过一个名字(函数名)封装起来，要想执行这个函数，只需调用其函数名即可

def 函数名(参数):

    ...
    函数体
    ...

函数的定义主要有如下要点：

def：表示函数的关键字
函数名：函数的名称，日后根据函数名调用函数
函数体：函数中进行一系列的逻辑计算，如：发送邮件、计算出 [11,22,38,888,2]中的最大数等...
参数：为函数体提供数据
返回值：当函数执行完毕后，可以给调用者返回数据。

语法定义

def test1():
    print("Hello test1")

test1()      #调用函数

含有参数的函数

def test2(a,b):
    res = a**b
    return res    #返回函数执行结果

c = test2(5,6)
print(c)

返回值

函数是一个功能块，该功能到底执行成功与否，需要通过返回值来告知调用者。
注意：

函数在执行过程中只要遇到return语句，就会停止执行并返回结果，return 语句代表着函数的结束

如果未在函数中指定return,那这个函数的返回值为None

函数参数与局部变量

形参变量只有在被调用时才分配内存单元，在调用结束时，即刻释放所分配的内存单元。因此，形参只在函数内部有效。函数调用结束返回主调用函数后则不能再使用该形参变量

实参可以是常量、变量、表达式、函数等，无论实参是何种类型的量，在进行函数调用时，它们都必须有确定的值，以便把这些值传送给形参。因此应预先用赋值，输入等办法使参数获得确定值

# 定义函数
def list(name):         # name叫做函数list的形式参数，简称：形参。
    print(name)

# 执行函数
list('zhubajie')        # 'zhubajie'叫做函数list的实际参数，简称：实参。

默认参数

def list(name,age = 18):
    print(%s:%s % (name,age))

# 指定参数执行函数
list('zhubajie',99)
# 使用默认参数执行函数
list('zhubajie')
# 注：默认参数需要放在参数列表最后

动态参数1：

# *args 会把多传入的参数变成一个元组形式

def func(*args):

    print args


# 执行方式一
func(11,33,4,4454,5)

# 执行方式二
li = [11,2,2,3,3,4,54]
func(*li)

动态参数2：

# *kwargs 会把多传入的参数变成一个字典形式

def func(**kwargs):

    print args


# 执行方式一
func(name＝'wupeiqi',age=18)

# 执行方式二
li = {'name':'wupeiqi', age:18, 'gender':'male'}
func(**li)

动态参数3：

# 多种动态参数可共用

def func(name,*args, **kwargs):
    
    print name
    print args
    print kwargs

局部变量

全局与局部变量:
在子程序中定义的变量称为局部变量，在程序的一开始定义的变量称为全局变量。
全局变量作用域是整个程序，局部变量作用域是定义该变量的子程序。当全局变量与局部变量同名时：在定义局部变量的子程序内，局部变量起作用；在其它地方全局变量起作用。

name = "外国"

def change_name(name):
    print("before change:",name)
    name = "内地"
    print("after change：", name)
    
change_name(name)

print("在外面看看name改了么?",name)

输出

before change: 外国
after change：内地
在外面看看name改了么? 外国

递归

在函数内部，可以调用其他函数。如果一个函数在内部调用自身本身，这个函数就是递归函数。

def calc(n):
    print(n)
    if int(n/2) ==0:
        return n
    return calc(int(n/2))

calc(10)

输出：
10
5
2
1

递归特性:

必须有一个明确的结束条件
每次进入更深一层递归时，问题规模相比上次递归都应有所减少
递归效率不高，递归层次过多会导致栈溢出（在计算机中，函数调用是通过栈（stack）这种数据结构实现的，每当进入一个函数调用，栈就会加一层栈帧，每当函数返回，栈就会减一层栈帧。由于栈的大小不是无限的，所以，递归调用的次数过多，会导致栈溢出）

匿名函数（lambda表达式）

学习条件运算时，对于简单的 if else 语句，可以使用三元运算来表示，即：

# 普通条件语句
if a == 1:
    name = 'zhubajie'
else:
    name = 'sunwukong'
    
# 三元运算
name = 'zhubajie' if a == 1 else 'sunwukong'

对于简单的函数，也存在一种简便的表达方式，即：lambda表达式

# ###################### 普通函数 ######################
# 定义函数（普通方式）
def func(arg):
    return arg + 1

# 执行函数
result = func(123)

# ###################### lambda ######################

# 定义函数（lambda表达式）
my_lambda = lambda arg : arg + 1

# 执行函数
result = my_lambda(123)

lambda存在意义就是对简单函数的简洁表示。

高阶函数

变量可以指向函数，函数的参数能接收变量，那么一个函数就可以接收另一个函数作为参数，这种函数就称之为高阶函数。

def add(x,y,f):
    return f(x) + f(y)

res = add(3,-6,abs)

print(res)

posted @ 2016-08-07 23:11 7y 阅读(277) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部