《Python进阶》学习笔记
《Python进阶》学习笔记
部分原创,仅个人关于《Python进阶》的学习笔记
import warnings
# 忽略警告
warnings.filterwarnings("ignore")
*args的用法
def test_args(f_arg,*argv):
print("第一个参数是:",f_arg)
for arg in argv:
print("其他argv参数是:",arg)
test_args('1','2','3')
第一个参数是: 1
其他argv参数是: 2
其他argv参数是: 3
**kwargs的用法
# 如果你想要在一个函数里处理带名字的参数,可以使用**kwargs
def greet_me(**kwargs):
for key,value in kwargs.items():
print("{0}:{1}".format(key,value))
greet_me(name="zhouwp")
name:zhouwp
使用*args和**kwargs调用函数
def test_args_kwargs(name,age,high):
print("name:",name)
print("age:",age)
print("high:",high)
args = ("zwp",38,164)
test_args_kwargs(*args)
name: zwp
age: 38
high: 164
kwargs = {"name": "zhouwp","age":38,"high":164}
test_args_kwargs(**kwargs)
name: zhouwp
age: 38
high: 164
迭代器(Iterator)
任意对象,只要定义了next或者__next__方法,它就是一个迭代器。
生成器(Generators)
def generator_fun():
for i in range(10):
yield i
for item in generator_fun():
print(item)
0
1
2
3
4
5
6
7
8
9
# 斐波那契数列
def fibon(n):
a = b = 1
for i in range(n):
yield a
a,b = b, a+b
for x in fibon(20):
print(x)
1
1
2
3
5
8
13
21
34
55
89
144
233
377
610
987
1597
2584
4181
6765
Python内置迭代函数iter
my_string = "hundsun"
my_iter = iter(my_string)
next(my_iter)
'h'
next(my_iter)
'u'
next(my_iter)
'n'
next(my_iter)
'd'
next(my_iter)
's'
next(my_iter)
'u'
next(my_iter)
'n'
Map
将一个函数映射到一个输入列表的所有元素上。
# 不用map的情况
items = [1,2,3,4,5]
squared = []
for i in items:
squared.append(i**2)
squared
[1, 4, 9, 16, 25]
# 接下来,我们试试用map的情况
squared_map = list(map(lambda x:x**2,items))
squared_map
[1, 4, 9, 16, 25]
Filter
过滤列表中的元素,返回一个由所有符合要求的元素所构成的列表,符合要求即函数映射到该元素时返回值为True
基本用法
number_list = range(-5,5)
less_than_zero = filter(lambda x:x<0,number_list)
print(less_than_zero)
print(list(less_than_zero))
<filter object at 0x000001594D0CD630>
[-5, -4, -3, -2, -1]
使用自定义函数
定义一个函数,然后使用 filter() 来过滤元素。
def is_even(x):
return x % 2 == 0
numbers = [1, 2, 3, 4, 5, 6]
even_numbers = filter(is_even, numbers)
print(list(even_numbers))
[2, 4, 6]
过滤多个序列
numbers = [1, 2, 3, 4]
letters = ['a', 'b', 'c', 'd']
pairs = filter(lambda x: x[0] % 2 == 0, zip(numbers, letters))
print(list(pairs))
[(2, 'b'), (4, 'd')]
使用 None 作为函数
如果函数参数为 None,则 filter() 会检查序列中的元素是否为真值。
numbers = [0, 1, 2, 3, 0, 5]
non_zero_numbers = filter(None, numbers)
print(list(non_zero_numbers))
[1, 2, 3, 5]
链式调用
可以链式使用 filter() 来应用多个过滤条件。
numbers = range(10)
filtered_numbers = filter(lambda x: x > 3, filter(lambda x: x % 2 == 0, numbers))
print(list(filtered_numbers))
[4, 6, 8]
Reduce
当要对一个列表进行计算并返回结果时,Reduce是一个非常有用的函数。
# 计算⼀个整数列表的乘积
from functools import reduce
product = reduce((lambda x,y:x*y),[1,2,3,4])
product
24
set数据结构
# set和list类似,区别在于set不能包含重复的值。
交集(intersection)
a = set([1,2,3,4,5,6])
b = set([3,5])
c = b.intersection(a)
c
{3, 5}
差集(difference)
# 相当于用一个集合的数据减去另一个集合的数据。
aa = set([1,2,3,4,5,6])
bb = set([3,5])
cc = a.difference(b)
cc
{1, 2, 4, 6}
三元运算符
# condition_is_true if condition else condition_is_false
实际业务编程中的应用案例
- 在生成用户界面或报告时,根据条件来决定显示的文本或样式
status = "active" if user.is_active else "inactive"
print(f"User status: {status}")
- 当需要一个变量的值,但这个值可能是 None 或者未定义时,可以设置一个默认值。
default_value = some_value if some_value is not None else "default"
- 在需要根据条件执行不同操作时,三元运算符可以减少 if-else 语句的使用。
result = process_data(data) if data else "No data to process"
- 条件赋值
temperature = "hot" if current_temp > 30 else "cold"
- 根据用户的角色或权限来决定是否允许执行某个操作。
is_allowed = True if user.role in ["admin", "editor"] else False
装饰器
装饰器是一种设计模式,它允许用户在不修改函数内容的情况下增加函数的功能。装饰器本质上是一个函数,它接收一个函数作为参数并返回一个新的函数。
def decorator(func):
def wrapper(*args, **kwargs):
# 在函数执行前做一些操作
result = func(*args, **kwargs)
# 在函数执行后做一些操作
return result
return wrapper
应用场景:
- 日志记录:在函数执行前后添加日志记录,方便调试和追踪。
- 性能测试:测量函数执行时间。
- 事务处理:确保数据库操作的原子性。
- 权限校验:在执行函数前检查用户权限。
- 缓存:缓存函数的结果,避免重复计算。
- 限流:控制函数的调用频率,防止滥用。
- 类型检查:确保函数参数符合预期类型。
- 异常处理:统一处理函数可能抛出的异常。
逻辑:
装饰器的逻辑主要涉及三个部分:
- 装饰器函数:这是一个接收函数作为参数的函数。
- 包装函数(wrapper):这是装饰器返回的新函数,它将被用来包装原始函数。
- 执行流程:
-
- 首先执行装饰器函数中的逻辑(如果有)。
- 然后调用原始函数,并传递必要的参数。
- 最后执行装饰器函数中的其他逻辑(如果有),并返回结果。
示例:
# 装饰器函数,say_hello 就是 func
def my_decorator(func):
# 内部定义的函数,用来包装 func 并添加额外的功能
def wrapper(*args, **kwargs):
print("Something is happening before the function is called.")
# func 即被包装函数
result = func(*args, **kwargs) ###实际对应的是say_hello函数,执行say_hello函数中的逻辑
print("Something is happening after the function is called.")
return result
return wrapper
@my_decorator
# say_hello函数是my_decorator装饰函数中func的
def say_hello():
print("Hello,ZWP!")
say_hello()
Something is happening before the function is called.
Hello,ZWP!
Something is happening after the function is called.
总结:
在这个例子中,my_decorator 是一个装饰器,它被用来装饰 say_hello 函数。当调用 say_hello() 时,实际上调用的是 wrapper 函数,它在调用原始的 say_hello 函数前后分别打印了一些信息。
高级用法:
使用 functools.wraps 来保持被装饰函数的元数据,如函数名和文档字符串。
from functools import wraps
#装饰函数,其中参数func,say_hello 就是 func
def my_decorator(func):
@wraps(func)
def wrapper(*args, **kwargs):
# 装饰逻辑
return func(*args, **kwargs)
return wrapper
@my_decorator
def greet(name):
"""Greet someone."""
print(f"Hello, {name}!")
print(greet.__name__)
print(greet.__doc__)
greet
Greet someone.
装饰器的应用场景
授权
from flask import Flask, jsonify, request, make_response, abort
from flask_httpauth import HTTPBasicAuth
from werkzeug.security import generate_password_hash, check_password_hash
app = Flask(__name__)
# 创建 HTTPBasicAuth 实例
auth = HTTPBasicAuth()
# 模拟的用户数据库
# 在实际应用中,您应该使用数据库来存储用户信息
# 这里我们使用字典来模拟
user_db = {
"john": generate_password_hash("hello"), # 存储密码的散列值
"susan": generate_password_hash("bye")
}
# 使用 verify_password 装饰器注册验证密码的函数
@auth.verify_password
def verify_password(username, password):
# 检查用户名是否存在于模拟数据库中
if username in user_db:
# 检查密码是否匹配存储的散列值
if check_password_hash(user_db[username], password):
return username
return None
# 定义一个受保护的路由
@app.route('/')
@auth.login_required # 使用 HTTPBasicAuth 的 login_required 装饰器
def index():
# 如果用户已认证,返回成功消息
auth = request.authorization
return jsonify({'message': f'Hello, {auth.username}! You are successfully authenticated.'})
# 错误处理,当认证失败时返回 401 错误
@auth.error_handler
def unauthorized():
return make_response(jsonify({'error': 'Unauthorized access'}), 401)
if __name__ == '__main__':
# 启动 Flask 应用
app.run(debug=True)
日终
def logit(func):
@wraps(func)
def with_logging(*args,**kwargs):
print(func.__name__+"was called")
return func(*args,**kwargs)
return with_logging
@logit
def addition_func(x):
return x+x
result = addition_func(4)
addition_funcwas called
result
8
@wraps接受一个函数来进行装饰,并加入了复制函数名称、注释文档、参数列表等功能。可以让我们在装饰器里面访问在装饰之前的函数的属性。
对象变动 Mutation
def add_to(n,target=[]):
target.append(n)
return target
add_to(1)
[1]
add_to(1)
[1, 1]
add_to(1)
[1, 1, 1]
def add_to_new(n,target_new=None):
if target_new is None:
target_new = []
target_new.append(n)
return target_new
add_to_new(1)
[1]
add_to_new(1)
[1]
add_to_new(1)
[1]
__slots__魔法
# 不使用__slots__
class MyClass(object):
def __init__(self,name,identifier):
self.name = name
self.identifier = identifier
self.set_up()
# 使用__slots__
# 减少内存占用
class MyClass(object):
__slots__ = ['name','identifier']
def __init__(self,name,identifier):
self.name = name
self.identifier = identifier
self.set_up()
容器(Collections)
defaultdict
例一
from collections import defaultdict
numbers = (
('aaa','1'),
('bbb','2'),
('ccc','3'),
('ddd','4'),
('eee','5'),
('fff','6'),
)
floor_number = defaultdict(list)
for name,num in numbers:
floor_number[name].append(num)
print(floor_number)
defaultdict(<class 'list'>, {'aaa': ['1'], 'bbb': ['2'], 'ccc': ['3'], 'ddd': ['4'], 'eee': ['5'], 'fff': ['6']})
例二
import collections
# 定义递归的 defaultdict 树结构
tree = lambda:collections.defaultdict(tree)
# 创建树的根节点
some_dict = tree()
# 添加一些节点
some_dict['mumbers']['favourite'] = "4"
import json
print(json.dumps(some_dict))
{"mumbers": {"favourite": "4"}}
Counter
# Counter是一个计数器,可以帮我们针对某项数据进行计算。
from collections import Counter
# 计数元素
words = ['apple', 'banana', 'apple', 'orange', 'banana', 'apple']
word_counts = Counter(words)
print(word_counts)
Counter({'apple': 3, 'banana': 2, 'orange': 1})
Deque
# dque提供了一个双端队列,可以从头\尾两端添加或者删除元素。
from collections import deque
# 创建双端队列
dq = deque()
# 添加元素
dq.append('a') # 在右侧添加
dq.append('b') # 在右侧添加
dq.append('c') # 在右侧添加
dq.appendleft('z') # 在左侧添加
print(dq)
# 弹出元素
print(dq.pop())
print(dq.popleft())
deque(['z', 'a', 'b', 'c'])
c
z
print(dq.popleft())
a
print(dq.popleft())
b
NamedTuple
namedtuple 是 tuple 的子类,允许你创建带有命名字段的元组。
例一
# 从 collections 模块导入 namedtuple 工厂函数
from collections import namedtuple
# 使用 namedtuple 创建一个名为 Man 的新类型
# Man 是一个元组,拥有三个命名字段:name(名字)、age(年龄)和 high(身高)
Man = namedtuple('Man', ['name', 'age', 'high'])
# 创建一个 Man 类型的新实例,名为 zhouwp
# 在这里,我们为 Man 类型的三个字段分别赋值:
# - name: "zhouwp",表示这个人的名字是 zhouwp
# - age: 38,表示这个人的年龄是 38 岁
# - high: 164,表示这个人的身高是 164 厘米
zhouwp = Man(name='zhouwp', age=38, high='164cm')
# 打印 zhouwp 对象,它是一个 Man 类型的实例
# 由于 Man 是 namedtuple 的一个子类,实例将按照定义的顺序打印字段名和值
zhouwp
Man(name='zhouwp', age=38, high='164cm')
例二
from collections import namedtuple
# 创建命名元组类型
Point = namedtuple('Point', ['x', 'y'])
# 创建命名元组
p = Point(11, y=22)
print(p.x)
print(p.y)
print(p)
11
22
Point(x=11, y=22)
枚举 Enumerate
enumerate() 函数返回的是一个元组,第一个元素是索引,第二个元素是可迭代对象的元素。
my_list = ['apple', 'banana', 'grapes', 'pear']
for counter,value in enumerate(my_list):
print(counter,value)
0 apple
1 banana
2 grapes
3 pear
for counter,value in enumerate(my_list,2):# 其中2表示从数字2开始枚举
print(counter,value)
2 apple
3 banana
4 grapes
5 pear
创建包含索引的元组列表
couter_list = list(enumerate(my_list,1))
couter_list
[(1, 'apple'), (2, 'banana'), (3, 'grapes'), (4, 'pear')]
案例一
在管理一个投资组合时,分析每个资产的表现。
# 假设这是一个投资组合中不同资产的回报率
portfolio_returns = {'Stock A': 0.08, 'Stock B': -0.05, 'Bond': 0.03, 'Commodity': 0.12}
# 获取资产名称列表
assets = list(portfolio_returns.keys())
# 分析每个资产的回报率
for index, asset in enumerate(assets, 1):
return_rate = portfolio_returns[asset]
print(f"资产 {index}: {asset}: 回报收益率:{return_rate:.2%}")
资产 1: Stock A: 回报收益率:8.00%
资产 2: Stock B: 回报收益率:-5.00%
资产 3: Bond: 回报收益率:3.00%
资产 4: Commodity: 回报收益率:12.00%
portfolio_returns.keys()
dict_keys(['Stock A', 'Stock B', 'Bond', 'Commodity'])
portfolio_returns.values()
dict_values([0.08, -0.05, 0.03, 0.12])
案例二
portfolio_returns = {'Stock A': 0.08, 'Stock B': -0.05, 'Bond': 0.03, 'Commodity': 0.12}
# 分析每个资产的回报率
for asset, return_rate in enumerate(portfolio_returns, 1):
print(f"资产 {asset}: 回报收益率: {return_rate}")
资产 1: 回报收益率: Stock A
资产 2: 回报收益率: Stock B
资产 3: 回报收益率: Bond
资产 4: 回报收益率: Commodity
type(portfolio_returns)
dict
案例三
# 假设这是连续几天的股票价格列表
stock_prices = [120.50, 121.75, 118.20, 122.45, 123.30]
# 使用enumerate()来获取价格及其索引(天数)
for day, price in enumerate(stock_prices):
if day == 0:
print(f"第 {day+1}天: 股价是 {price}")
else:
previous_price = stock_prices[day - 1]
price_change = price - previous_price
print(f"第 {day+1}天: 股价是 {price}, 相比上一个交易日增长: {price_change:.2f}")
第 1天: 股价是 120.5
第 2天: 股价是 121.75, 相比上一个交易日增长: 1.25
第 3天: 股价是 118.2, 相比上一个交易日增长: -3.55
第 4天: 股价是 122.45, 相比上一个交易日增长: 4.25
第 5天: 股价是 123.3, 相比上一个交易日增长: 0.85
案例四
# 假设这是连续几天的股票价格列表
stock_prices = [120.50, 121.75, 118.20, 122.45, 123.30]
# 使用enumerate()来获取价格及其索引(天数)
for day, price in enumerate(stock_prices):
if day == 0:
print(f"第 {day+1} 天: 开盘价: {price}")
else:
previous_price = stock_prices[day - 1]
price_change = (price - previous_price)/previous_price
print(f"第 {day+1} 天: 价格是: {price}, 相比上一个交易日涨跌幅: {price_change:.2f}%")
第 1 天: 开盘价: 120.5
第 2 天: 价格是: 121.75, 相比上一个交易日涨跌幅: 0.01%
第 3 天: 价格是: 118.2, 相比上一个交易日涨跌幅: -0.03%
第 4 天: 价格是: 122.45, 相比上一个交易日涨跌幅: 0.04%
第 5 天: 价格是: 123.3, 相比上一个交易日涨跌幅: 0.01%
对象自省
stock_prices_new = [120.50, 121.75, 118.20, 122.45,122.45, 123.30]
type(stock_prices_new)
list
len(stock_prices_new)
6
stock_prices_new
[120.5, 121.75, 118.2, 122.45, 122.45, 123.3]
dir
列出⼀个对象所拥有的属性和⽅法。
dir(stock_prices_new)
['__add__',
'__class__',
'__class_getitem__',
'__contains__',
'__delattr__',
'__delitem__',
'__dir__',
'__doc__',
'__eq__',
'__format__',
'__ge__',
'__getattribute__',
'__getitem__',
'__getstate__',
'__gt__',
'__hash__',
'__iadd__',
'__imul__',
'__init__',
'__init_subclass__',
'__iter__',
'__le__',
'__len__',
'__lt__',
'__mul__',
'__ne__',
'__new__',
'__reduce__',
'__reduce_ex__',
'__repr__',
'__reversed__',
'__rmul__',
'__setattr__',
'__setitem__',
'__sizeof__',
'__str__',
'__subclasshook__',
'append',
'clear',
'copy',
'count',
'extend',
'index',
'insert',
'pop',
'remove',
'reverse',
'sort']
# 返回元素在列表中出现的次数
stock_prices_new.count(122.45)
2
inspect模块
import inspect
print(inspect.getmembers(str))
[('__add__', <slot wrapper '__add__' of 'str' objects>), ('__class__', <class 'type'>), ('__contains__', <slot wrapper '__contains__' of 'str' objects>), ('__delattr__', <slot wrapper '__delattr__' of 'object' objects>), ('__dir__', <method '__dir__' of 'object' objects>), ('__doc__', "str(object='') -> str\nstr(bytes_or_buffer[, encoding[, errors]]) -> str\n\nCreate a new string object from the given object. If encoding or\nerrors is specified, then the object must expose a data buffer\nthat will be decoded using the given encoding and error handler.\nOtherwise, returns the result of object.__str__() (if defined)\nor repr(object).\nencoding defaults to sys.getdefaultencoding().\nerrors defaults to 'strict'."), ('__eq__', <slot wrapper '__eq__' of 'str' objects>), ('__format__', <method '__format__' of 'str' objects>), ('__ge__', <slot wrapper '__ge__' of 'str' objects>), ('__getattribute__', <slot wrapper '__getattribute__' of 'str' objects>), ('__getitem__', <slot wrapper '__getitem__' of 'str' objects>), ('__getnewargs__', <method '__getnewargs__' of 'str' objects>), ('__getstate__', <method '__getstate__' of 'object' objects>), ('__gt__', <slot wrapper '__gt__' of 'str' objects>), ('__hash__', <slot wrapper '__hash__' of 'str' objects>), ('__init__', <slot wrapper '__init__' of 'object' objects>), ('__init_subclass__', <built-in method __init_subclass__ of type object at 0x00007FFB51E79F30>), ('__iter__', <slot wrapper '__iter__' of 'str' objects>), ('__le__', <slot wrapper '__le__' of 'str' objects>), ('__len__', <slot wrapper '__len__' of 'str' objects>), ('__lt__', <slot wrapper '__lt__' of 'str' objects>), ('__mod__', <slot wrapper '__mod__' of 'str' objects>), ('__mul__', <slot wrapper '__mul__' of 'str' objects>), ('__ne__', <slot wrapper '__ne__' of 'str' objects>), ('__new__', <built-in method __new__ of type object at 0x00007FFB51E79F30>), ('__reduce__', <method '__reduce__' of 'object' objects>), ('__reduce_ex__', <method '__reduce_ex__' of 'object' objects>), ('__repr__', <slot wrapper '__repr__' of 'str' objects>), ('__rmod__', <slot wrapper '__rmod__' of 'str' objects>), ('__rmul__', <slot wrapper '__rmul__' of 'str' objects>), ('__setattr__', <slot wrapper '__setattr__' of 'object' objects>), ('__sizeof__', <method '__sizeof__' of 'str' objects>), ('__str__', <slot wrapper '__str__' of 'str' objects>), ('__subclasshook__', <built-in method __subclasshook__ of type object at 0x00007FFB51E79F30>), ('capitalize', <method 'capitalize' of 'str' objects>), ('casefold', <method 'casefold' of 'str' objects>), ('center', <method 'center' of 'str' objects>), ('count', <method 'count' of 'str' objects>), ('encode', <method 'encode' of 'str' objects>), ('endswith', <method 'endswith' of 'str' objects>), ('expandtabs', <method 'expandtabs' of 'str' objects>), ('find', <method 'find' of 'str' objects>), ('format', <method 'format' of 'str' objects>), ('format_map', <method 'format_map' of 'str' objects>), ('index', <method 'index' of 'str' objects>), ('isalnum', <method 'isalnum' of 'str' objects>), ('isalpha', <method 'isalpha' of 'str' objects>), ('isascii', <method 'isascii' of 'str' objects>), ('isdecimal', <method 'isdecimal' of 'str' objects>), ('isdigit', <method 'isdigit' of 'str' objects>), ('isidentifier', <method 'isidentifier' of 'str' objects>), ('islower', <method 'islower' of 'str' objects>), ('isnumeric', <method 'isnumeric' of 'str' objects>), ('isprintable', <method 'isprintable' of 'str' objects>), ('isspace', <method 'isspace' of 'str' objects>), ('istitle', <method 'istitle' of 'str' objects>), ('isupper', <method 'isupper' of 'str' objects>), ('join', <method 'join' of 'str' objects>), ('ljust', <method 'ljust' of 'str' objects>), ('lower', <method 'lower' of 'str' objects>), ('lstrip', <method 'lstrip' of 'str' objects>), ('maketrans', <built-in method maketrans of type object at 0x00007FFB51E79F30>), ('partition', <method 'partition' of 'str' objects>), ('removeprefix', <method 'removeprefix' of 'str' objects>), ('removesuffix', <method 'removesuffix' of 'str' objects>), ('replace', <method 'replace' of 'str' objects>), ('rfind', <method 'rfind' of 'str' objects>), ('rindex', <method 'rindex' of 'str' objects>), ('rjust', <method 'rjust' of 'str' objects>), ('rpartition', <method 'rpartition' of 'str' objects>), ('rsplit', <method 'rsplit' of 'str' objects>), ('rstrip', <method 'rstrip' of 'str' objects>), ('split', <method 'split' of 'str' objects>), ('splitlines', <method 'splitlines' of 'str' objects>), ('startswith', <method 'startswith' of 'str' objects>), ('strip', <method 'strip' of 'str' objects>), ('swapcase', <method 'swapcase' of 'str' objects>), ('title', <method 'title' of 'str' objects>), ('translate', <method 'translate' of 'str' objects>), ('upper', <method 'upper' of 'str' objects>), ('zfill', <method 'zfill' of 'str' objects>)]
type(inspect.getmembers(str))
list
import pandas as pd
data = inspect.getmembers(str)
df = pd.DataFrame(data)
df
0 | 1 | |
---|---|---|
0 | __add__ | <slot wrapper '__add__' of 'str' objects> |
1 | __class__ | <class 'type'> |
2 | __contains__ | <slot wrapper '__contains__' of 'str' objects> |
3 | __delattr__ | <slot wrapper '__delattr__' of 'object' objects> |
4 | __dir__ | <method '__dir__' of 'object' objects> |
... | ... | ... |
76 | swapcase | <method 'swapcase' of 'str' objects> |
77 | title | <method 'title' of 'str' objects> |
78 | translate | <method 'translate' of 'str' objects> |
79 | upper | <method 'upper' of 'str' objects> |
80 | zfill | <method 'zfill' of 'str' objects> |
81 rows × 2 columns
推导式
列表推导式 list comprehensions
规范
multiple = [i for i in range(30) if i%3 is 0]
multiple
[0, 3, 6, 9, 12, 15, 18, 21, 24, 27]
# 快速生成列表
# 普通方法
squared_1 = []
for x in range(10):
squared_1.append(x**2)
squared_1
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
# 列表推导式方法
squared_2 = [x**2 for x in range(10)]
squared_2
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
字典推导式 dict comprehensions
mcase = {'a': 10, 'b': 34, 'A': 7, 'Z': 3}
# 使用字典推导式创建一个新的字典,其中所有键都是小写的
lowercase_mcase = {key.lower(): value for key, value in mcase.items()}
lowercase_mcase
{'a': 7, 'b': 34, 'z': 3}
集合推导式 set comprehensions
multiple_set = {i for i in range(30) if i%3 is 0}
multiple_set
{0, 3, 6, 9, 12, 15, 18, 21, 24, 27}
finally从句
try:
xxxxx
except IOError as e:
xxxxx
finally:
xxxxx
try/else 从句
try:
xxxxx
except Exception:
xxxxx
else:
xxxxx
finally:
xxxxx
lambda表达式
a = [(1,2),(4,1),(9,10),(13,-3)]
a.sort(key=lambda x:x[0])
a
[(1, 2), (4, 1), (9, 10), (13, -3)]
a.sort(key=lambda x:x[1])
a
[(13, -3), (4, 1), (1, 2), (9, 10)]
open函数
with open(file, mode) as variable:
file: 要打开的文件的路径。
mode: 打开文件的模式,常见的模式有:
'r': 读取模式,默认值。
'w': 写入模式,会覆盖文件内容。
'a': 追加模式,会在文件末尾追加内容。
'b': 二进制模式,用于读写二进制文件。
'+': 更新模式,可以读写文件。
variable: 打开的文件对象的变量名。
文本文件
读取文本文件
with open('text.txt','r',encoding='utf-8') as f:
content = f.read()
print(content)
First line
Second line
Third line
文平
写入文本文件
with open('text.txt','w',encoding='utf-8') as f:
f.write('你你好你好你好\n你好你好你好你好好\n')
with open(f'd:/Notebook/Test/text.txt','r',encoding='utf-8') as f:
content = f.read()
print(content)
First line
Second line
Third line
追加内容到文本文件
with open('text.txt','a',encoding='utf-8') as f:
f.write('文平')
with open(f'd:/Notebook/Test/text.txt','r',encoding='utf-8') as f:
content = f.read()
print(content)
First line
Second line
Third line
写入多行到文本文件
lines = ['First line', 'Second line', 'Third line']
with open('text.txt','w',encoding='utf-8') as file:
for line in lines:
file.write(line + '\n') # 每个line后面添加换行符
逐行读取文本文件
with open('text.txt','r',encoding='utf-8') as file:
for line in file:
print(line.strip()) # 使用strip()去除行尾的换行符
First line
Second line
Third line
二进制文件
### 读取二进制文件
with open('image.png','rb') as f:
data = f.read()
print(data)
b'\xff\xd8\xff\xe0\x00\x10JFIF\x00\x01\x01\x00\x00\x01\x00\x01\x00\x00\xff\xdb\x00C\x00\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\xff\xdb\x00C\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\xff\xc0\x00\x11\x08\x00?\x00\xaa\x03\x01"\x00\x02\x11\x01\x03\x11\x01\xff\xc4\x00\x15\x00\x01\x01\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\n\xff\xc4\x00\x14\x10\x01\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\xff\xc4\x00\x14\x01\x01\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\xff\xc4\x00\x14\x11\x01\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\xff\xda\x00\x0c\x03\x01\x00\x02\x11\x03\x11\x00?\x00\xbf\x80\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x1f\xff\xd9'
with open('image.png', 'r+b') as f:
# 假设我们要更新文件中的某些数据
f.seek(0) # 移动到文件开头
data = f.read(10) # 读取前10个字节
modified_data = data.replace(b'old', b'new') # 修改数据
f.seek(0) # 重新移动到文件开头
f.write(modified_data) # 写入修改后的数据
CSV文件
# 写入CSV文件
import csv
rows = [
['姓名', '年龄', '职业'],
['张三', '28', '工程师'],
['李四', '35', '设计师']
]
with open('output.csv', 'w', newline='', encoding='utf-8') as file:
writer = csv.writer(file)
writer.writerows(rows)
# 读取CSV文件
import csv
with open('output.csv', 'r', newline='', encoding='utf-8') as file:
reader = csv.reader(file)
for row in reader:
print(row) # 每行作为一个列表打印
['姓名', '年龄', '职业']
['张三', '28', '工程师']
['李四', '35', '设计师']
JSON文件
写入JSON文件
import json
# 数据字典
data = {
"name": "张三",
"age": 30,
"city": "北京"
}
# 写入JSON文件
with open('output.json', 'w', encoding='utf-8') as file:
json.dump(data, file, ensure_ascii=False, indent=4)
读取JSON文件
import json
# 读取JSON文件
with open('output.json', 'r', encoding='utf-8') as file:
data = json.load(file)
print(data)
{'name': '张三', 'age': 30, 'city': '北京'}
XML文件
写入XML文件
import xml.etree.ElementTree as ET
# 创建XML元素
root = ET.Element("data")
child = ET.SubElement(root, "item", attrib={"key": "value"})
child.text = "Example"
# 写入XML文件
tree = ET.ElementTree(root)
tree.write('output.xml', encoding='utf-8', xml_declaration=True)
读取XML文件
import xml.etree.ElementTree as ET
# 读取XML文件
tree = ET.parse('output.xml')
root = tree.getroot()
for child in root:
print(child.tag, child.attrib)
item {'key': 'value'}
Excel文件
写入Excel文件(使用pandas)
import pandas as pd
# 创建DataFrame
df = pd.DataFrame({
"Column1": [1, 2, 3],
"Column2": ["A", "B", "C"]
})
# 写入Excel文件
df.to_excel('output.xlsx', index=False)
读取Excel文件(使用pandas)
import pandas as pd
# 读取Excel文件
df = pd.read_excel('output.xlsx')
# 打印DataFrame
print(df)
Column1 Column2
0 1 A
1 2 B
2 3 C
PDF 文件
# 安装PyPDF2
# pip install PyPDF2
from PyPDF2 import PdfReader
# 读取PDF文件
with open('PDF-TEST.pdf', 'rb') as file:
reader = PdfReader(file)
for page_num in range(len(reader.pages)):
print(reader.pages[page_num].extract_text())
大清亡了?
WORD 文件
# pip install python-docx
from docx import Document
# 创建一个新的Word文档
doc = Document()
# 添加一个新段落
doc.add_paragraph('Hello, World!')
# 添加另一个段落并设置不同的格式
p = doc.add_paragraph('这是另一个段落。')
run = p.add_run('这是粗体和斜体。')
run.bold = True
run.italic = True
# 保存文档
doc.save('document.docx')
from docx import Document
# 打开Word文档
doc = Document('document.docx')
# 打印文档中的每个段落
for para in doc.paragraphs:
print(para.text)
Hello, World!
这是另一个段落。这是粗体和斜体。
图像文件
from PIL import Image
# 创建一个新的图像
new_img = Image.new('RGB', (100, 100), color = 'red')
# 保存图像文件
new_img.save('image.png')
from PIL import Image
# 打开图像文件
with Image.open('image.png') as img:
img.show() # 显示图像
本文来自博客园,作者:江雪独钓翁,转载请注明原文链接:https://www.cnblogs.com/zhouwp/p/18228660