Python3基础（3）集合、文件操作、字符转编码、函数(args和kwargs)、全局/局部变量、递归、函数式编程、高阶函数

---------------个人学习笔记---------------

----------------本文作者疆--------------

------点击此处链接至博客园原文------

1.集合

集合是无序的、不重复的数据组合，主要作用是：关系测试、去重等，用{}表示，set() 创建集合。

--------------关系测试------------------------------

intersection() 求集合交集运算符为 &

union() 求集合并集运算符为 |

difference() 求集合差集运算符为 -

issubset() 判断是否为子集

issuperset() 判断是否为父集

symmetric_difference() 求对称差集，即并集-交集运算符为 ^

isdisjoint() 若两集合无交集返回True

--------------基本操作------------------------------

add() 向集合增加1个元素

update() 向集合增加多个元素,括号内为列表

remove() 删除集合1个元素，该元素必须存在，否则报错

len() 集合长度

in 判断元素是否在集合内

not in 判断元素不否在集合内

copy() 浅复制

pop() 删除任意某个元素并返回该元素

discard() 删除集合1个元素，该元素可以不存在，不存在则不做任何操作，存在则删除

2.文件操作

f = open(文件名，打开文件模式) 打开文件返回文件句柄，有时根据情况需指定encoding，也有with open() as f: 这种方式（称为：管理上下文）当with代码块执行完毕，内部将自动关闭并释放资源

f.read() 一次读取文件全部内容，若连续两次f.read()则第2次读不到任何东西，因为第一次read后光标已经至末尾模式可选为“r”

f.write() 向文件写入内容（创建新文件，若有同名文件则覆盖）模式可选为“w”

f.write() 向文件中末尾追加内容模式选为“a”

f.readline() 读取文件一行

f.readlines() 一次性按行读取文件，返回列表（每行为一个元素），适合处理小文件

for line in f: 大文件可逐行读取，内存中只保留一行数据，效率最高(文件变成迭代器)

f.tell() 文件句柄指针位置（可理解为光标位置，按字符计数）

f.seek() 设置句柄指针位置，如f.seek(0) 则光标移至文件开头

f.encoding 该文件的编码

f.name 该文件的名字

f.isatty() 判断是否为终端设备，如打印机

f.flush() 强制刷新，io往文件写的时候是等到待写入文件达到buffer_size才一起写入，f.flush()可以强制刷新，直接即时写入

f.truncate() 截取x个字符

f.close() 关闭文件句柄

----------------------------------------打开文件模式------------------------------------------

r 只读，若文件不存会报错

w 只写，若文件不存在则自动创建再写入，会覆盖文件

a 追加，若文件不存在则自动创建再写入，不会覆盖文件，但在末尾追加

r+ 读写，若文件不存会报错，写会覆盖文件（比如读三行后后再写，写的时候不是从光标当前位置写了，而是在末尾追加写）

w+ 写读，若文件不存在则自动创建再写入，写会覆盖文件

a+ 追加，若文件不存在则自动创建再写入，写不会覆盖文件，但在末尾追加

wb，rb类似于w、r，但用于二进制文件（如视频）或Python3中网络传输

---------------------------------------------------------------------------------------------------------

3.文件修改

上述文件操作中修改文件会将原文件覆盖

方法一：类似于vim先将文件加载到内存里再修改，效率低

方法二：读文件修改后写入一个新的文件，相比较效率更高

注意字符串操作有返回值，原字符串值不被修改

4.进度条(缓冲flush)

5.字符转编码

-----------------------------------Python2------------------------------------

系统默认编码 sys.getdefaultencoding()为ASCII编码

程序中若带有中文需在开头申明UTF-8编码

UTF-8字符串str1转为GBK：str1.decode("utf-8").encode("gbk")

GBK字符串str2转为UTF-8:str2.decode("gbk").encode("utf-8")

其余未涉及的转编码类似，都要经过unicode

-----------------------------------Python3--------------------------------------

默认编码为Unicode，赋值一个字符串则为Unicode编码，字符转编码与Python2相同

Python3中encode()不仅将字符编码集改了，还会转成bytes类型

如开头申明 # -*-coding:gbk-*-则意味着文件编码为gbk 赋值一个字符串仍为Unicode编码，而不是gbk

6.函数

------------------------------三种编程范式------------------------------

面向对象：类 class

面向过程：过程 def,没有返回值的函数，Python中隐式地返回None

函数式编程？：函数 def，代码重用、保持一致性、可扩展性

-------------------------------------------------------------------------------

函数内return后不再执行代码

若函数return多个值，而调用函数赋给1个变量，则返回值以tuple形式返回

位置参数调用、关键参数调用，两种方式混合时关键参数不能写在位置参数前面

默认参数，定义形参时同时赋默认值，调用函数时默认参数非必须传递赋值

----------------------------------函数的非固定参数------------------------------

即实参传递数目不固定，形参如何声明？参数组

实参转换为元组

实参转换为字典，实参需以关键参数形式写

7.获取系统当前时间

import time

time_format = "%Y-%m-%d %X"

time_current = time.strftime(time_format)

8.全局/局部变量

局部变量只在函数内部生效，其作用域为对应定义的函数

全局变量应在程序一开始顶级定义，其作用域为整个程序

允许函数内部有与全局变量同名的变量，在该函数内部该变量起作用，在其余地方全局变量起作用

若想在函数内部改变全局变量的值，可在函数内部用global声明，不建议这么做，易造成程序逻辑混乱

除了整数、字符串未加global时不能在函数内部修改全局变量，其余像（列表、字典、集合...）均可不加global就能在函数内部修改全局变量！

9.递归

如果一个函数在内部调用自身，该函数就是递归函数

------------------------递归特性------------------------

必须有一个明确的结束条件（最大递归999次）

每次进入更深一层递归时，问题规模相比上次递归都应有所减少

递归效率不高，递归层次过多会导致栈溢出（函数调用是通过栈stack这种数据结构实现的）

10.函数式编程（lisp、hashshell、erlang）

虽然可以归结到面向过程的程序设计，但其思想更接近数字计算。由于我们在Python中常定义函数中涉及一些逻辑判断（变量状态不确定），

使得输入确定，输出不确定，即对于同样的输入，可能得到不同的输出，这种函数有副作用。而函数式编程更侧重数字计算，输入确定，

输出确定。Python对函数式编程提供部分支持，由于Python允许使用变量，因此，Python不是纯函数式编程语言。

11.高阶函数

一个函数接收另一个函数作为参数，这种函数称为高阶函数

posted @ 2019-05-18 11:15 JiangJ~ 阅读(242) 评论(0) 收藏举报

刷新页面返回顶部

点滴

强化技术夯实根基

Python3基础（3）集合、文件操作、字符转编码、函数(args和kwargs)、全局/局部变量、递归、函数式编程、高阶函数

公告

点滴

强化技术 夯实根基

Python3基础（3）集合、文件操作、字符转编码、函数(*args和*kwargs)、全局/局部变量、递归、函数式编程、高阶函数

公告

强化技术夯实根基

Python3基础（3）集合、文件操作、字符转编码、函数(args和kwargs)、全局/局部变量、递归、函数式编程、高阶函数