随笔分类 - python3
摘要:突然被告知DB中某个关键字段长度要增大,涉及到N张表,改起来超麻烦,想着用代码改,比较少写这种增删表或者改变表结构的代码,记录下。 import pymysql def modifyFieldVarcharLen(config, new_column_length): connection = py
阅读全文
摘要:sqlite3 import sqlite3 try: # 连接到SQLite数据库,数据库文件是test.db,如果文件不存在,会自动在当前目录创建: conn = sqlite3.connect("test.db") # 创建一个Cursor cursor = conn.cursor() # 执
阅读全文
摘要:无限迭代器 import itertools # 无限迭代器 # 无限序列只有在for迭代时才会无限地迭代下去,如果只是创建了一个迭代对象,它不会事先把无限个元素生成出来,事实上也不可能在内存中创建无限多个元素。 natuals = itertools.count(1) odd = itertool
阅读全文
摘要:hashlib import hashlib # MD5 是最常见的哈希算法,速度很快,生成结果是固定的128 bit/16字节,通常用一个32位的16进制字符串表示。 md5 = hashlib.md5() md5.update("hello".encode()) print(md5.hexdig
阅读全文
摘要:常用内置函数 # lambda 函数 add = lambda a, b, c: a + b + c print(add(1, 2, 3)) # 6 # sorted 函数 a_l = [1, 3, 5, 7, 0, -1, -9, -4, -5, 8] print(sorted(a_l)) # [
阅读全文
摘要:日期时间 from datetime import datetime, timedelta, timezone now = datetime.now() print(now) # 2024-02-02 14:27:12.247121 dt = datetime(2023, 12, 31, 12, 3
阅读全文
摘要:namedtuple # namedtuple是一个函数,它用来创建一个自定义的tuple对象,并且规定了tuple元素的个数,并可以用属性而不是索引来引用tuple的某个元素。 # 用namedtuple可以很方便地定义一种数据类型,它具备tuple的不变性,又可以根据属性来引用 Coord =
阅读全文
摘要:Base64是一种用64个字符来表示任意二进制数据的方法。 import base64 by = "abc中文".encode() b = base64.b64encode(by) print(by) # b'abc\xe4\xb8\xad\xe6\x96\x87' print(b) # b'YWJ
阅读全文
摘要:在命令行程序中需要获取命令行参数可以使用sys库和argparse库。sys库可用于处理简单的命令行参数,argparse库可用于处理复杂的命令行参数。 # argparse 解析命令行参数 import argparse, sys def main(): # 定义一个ArgumentParser实
阅读全文
摘要:内容总结自官方文档 https://www.selenium.dev/documentation/ Selenium WebDriver WebDriver 被设计为一个简单而简洁的编程接口。WebDriver 是一个紧凑的面向对象 API。它有效地驱动浏览器。 Selenium 通过使用 WebD
阅读全文
摘要:https://docs.scrapy.org/ scrapy介绍 Scrapy 是一个用于抓取网站和提取结构化数据的应用程序框架,可用于各种有用的应用程序,如数据挖掘、信息处理或历史档案。 Scrapy 中的数据流由执行引擎控制,如下所示: 1 引擎从 Spider 获取初始爬行请求。 2 引擎在
阅读全文
摘要:检索资料时看到比较完备的资料,想着要把所有页面保存下来。正好使用下requests和BeautifulSoup库获取和解析所有的静态页,把静态页保存为单个pdf文件,然后再把所有的pdf文件合并起来生成1个PDF文档。 本来想使用python子进程调用wkhtmltopdf工具把静态页生成为单个pd
阅读全文
摘要:pyttsx3 pyttsx3是一个Python库,用于将文本转换为语音输出。它支持多种操作系统,包括Windows和macOS,并且提供了丰富的功能来控制文本到语音的转换过程。 import pyttsx3 msg = "Hello World!" pyttsx3.speak(msg)
阅读全文
摘要:urllib import urllib.request import urllib.parse import urllib.error url = "http://localhost:3000/request.php" # 直接使用 with urllib.request.urlopen(url)
阅读全文
摘要:相关概念说明 进程 进程就是一个程序在一个数据集上的一次动态执行过程。 进程一般由程序、数据集、进程控制块三部分组成。程序用来描述进程要完成哪些功能以及如何完成;数据集则是程序在执行过程中所需要使用的资源;进程控制块用来记录进程的外部特征,描述进程的执行变化过程,系统可以利用它来控制和管理进程,它是
阅读全文
摘要:import matplotlib.pyplot as plt import numpy as np N = 8 i = 0 # 指定一个画板 fig = plt.figure(figsize=(20, 5 * N)) x = np.arange(0, 3 * np.pi, 0.1) y_sin =
阅读全文
摘要:安装 pip install pillow 引入 from PIL import Image, ImageFilter, ImageDraw, ImageFont, ImageOps, ImageEnhance import os img_dir = "../../files/" img_gen_d
阅读全文
摘要:控制结构 条件判断 n = 10 i = 2 if n == i: print("equal") elif n < i: print("lower") else: print("higher") score = 89 match score: case 100: print("level A+")
阅读全文
摘要:文件IO 读写txt文件 with open("../files/test.txt", encoding="utf-8-sig") as f: str = f.read() lst = [] if str: data = str.split("\n") for row in data: if len
阅读全文
摘要:有时间看下seaborn库,写一些demo记录下 import numpy as np import seaborn as sns import matplotlib.pyplot as plt fig = plt.figure(figsize=(20, 10)) # 解决中文不显示和负号不显示问题
阅读全文