04 2018 档案
python队列、线程、进程、协程
摘要:转自:https://www.cnblogs.com/wangqiaomei/p/5682669.html 目录: 一、queue 1.1 queue用法 # 先进先出队列 # put放数据,是否阻塞,阻塞时的超时事件 # get取数据(默认阻塞),是否阻塞,阻塞时的超时事件 # 队列的最大长度:q 阅读全文
posted @ 2018-04-28 13:59 math98 编辑
proxy
摘要:import random import requests from bs4 import BeautifulSoup def random_headers(): ua_lst = ['Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_6_8; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Versi... 阅读全文
posted @ 2018-04-24 01:25 math98 编辑
爬取-入库
摘要:练习requests/BeautifulSoup选择器/sqlite3的用法 阅读全文
posted @ 2018-04-23 11:03 math98 编辑
header格式化
摘要:从火狐浏览器上每次复制header字符串修改成字典类型比较麻烦,所以写个代码,不用每次都花时间修改cookie字符串。 阅读全文
posted @ 2018-04-20 10:55 math98 编辑
Python操作剪贴板
摘要:import win32clipboard as w import win32con def getText(): w.OpenClipboard() d = w.GetClipboardData(win32con.CF_UNICODETEXT) w.CloseClipboard() return d def setText(aString): w.O... 阅读全文
posted @ 2018-04-20 09:55 math98 阅读(368) 评论(0) 推荐(0) 编辑
Xpath语法与lxml库的用法(etree_xpath)
摘要:来一段代码先: BeautifulSoup已经是非常强大的库了,不过还有一些比较流行的解析库,例如 lxml,使用的是 Xpath 语法,同样是效率比较高的解析方法。如果对 BeautifulSoup 使用不太习惯的话,可以尝试下 Xpath 安装 XPath语法 XPath 是一门在 XML 文档 阅读全文
posted @ 2018-04-19 15:01 math98 编辑
python字典遍历的几种方法
摘要:(1)遍历key值 >>> a {'a': '1', 'b': '2', 'c': '3'} >>> for key in a: print(key+':'+a[key]) a:1 b:2 c:3 >>> for key in a.keys(): print(key+':'+a[key]) a:1 阅读全文
posted @ 2018-04-19 13:24 math98 编辑
urllib相关
摘要:import urllib.request #Python3中的urlretrieve下载 url = 'http://imgsrc.baidu.com/baike/pic/item/d002b34ba8072cb382025cfc.jpg' filename = 'd:/project/test/guo.jpg' urllib.request.urlretrieve(url, filename... 阅读全文
posted @ 2018-04-19 11:02 math98 编辑
Python之os.path
摘要:os.path模块主要用于常用路径名操作,在编程中使用频率特高 os.path常用函数 示例 参考:https://www.cnblogs.com/wuxie1989/p/5623435.html 阅读全文
posted @ 2018-04-19 10:49 math98 阅读(110) 评论(0) 推荐(0) 编辑
Python之数学(math)和随机数(random)
摘要:math包包含了最基本的数学运算函数,如果想要更加高级的数学功能,可以使用标准库外的numpy和scipy库,他们不但支持数组和矩阵运算, 还有丰富的数学和物理方程可供使用 random包可以用来生成随机数,随机数不仅可以用于数学用途,还经常被嵌入到算法中 math包 1. 常数 math包主要处理 阅读全文
posted @ 2018-04-19 10:42 math98 阅读(678) 评论(0) 推荐(0) 编辑
NumPy库知识结构
摘要:NumPy库知识结构 阅读全文
posted @ 2018-04-19 10:39 math98 编辑
SQLite和Excel操作
摘要:代码写的很简单,一个类,在构造函数的时候初始化数据库对象,析构的时候释放数据库对象。一个插入数据函数,一个读取Excel函数,代码: 阅读全文
posted @ 2018-04-19 10:31 math98 阅读(1063) 评论(0) 推荐(0) 编辑
Python之sqlite3
摘要:Python sqlite3数据库是一款非常小巧的内置模块,它使用一个文件存储整个数据库,操作十分方便,相比其他大型数据库来说,确实有些差距。但是在性能表现上并不逊色,麻雀虽小,五脏俱全,sqlite3实现了多少sql-92标准,比如说transaction、trigger和复杂的查询等。 描述 P 阅读全文
posted @ 2018-04-19 10:14 math98 阅读(206) 评论(0) 推荐(0) 编辑
Python正则表达式
摘要:Python3 正则表达式 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。 Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。 re 模块使 Python 语言拥有全部的正则表达式功能。 compile 函数根据一个模式字符串和 阅读全文
posted @ 2018-04-19 07:55 math98 编辑
Python--csv文件处理
摘要:CSV(Comma-Separator Values)逗号分割值,由于是纯文本文件,任何编辑器都可以打开。下面用csv和pandas两种方式进行csv文件操作 原始csv文件内容 Supplier Name,Invoice Number,Part Number,Cost,Purchase Date 阅读全文
posted @ 2018-04-18 11:08 math98 编辑
Python之json文件
摘要:概念: 序列化(Serialization):将对象的状态信息转换为可以存储或可以通过网络传输的过程,传输的格式可以是JSON,XML等。反序列化就是从存储区域(JSON,XML)读取反序列化对象的状态,重新创建该对象。 JSON(Java Script Object Notation):一种轻量级 阅读全文
posted @ 2018-04-18 11:06 math98 编辑
Python之xpath
摘要:xpath是一种在XML文档中定位元素的语言,常用于xml、html文件解析,比css选择器使用方便XML文件最小构成单元: - element(元素节点) - attribute(属性节点) - text(文本) - namespace(命名空间) - processing-instruction 阅读全文
posted @ 2018-04-18 11:02 math98 编辑
os文件操作收集
摘要:python中对文件、文件夹(文件操作函数)的操作需要涉及到os模块和shutil模块。 得到当前工作目录,即当前Python脚本工作的目录路径: os.getcwd() 返回指定目录下的所有文件和目录名:os.listdir() 函数用来删除一个文件:os.remove() 删除多个目录:os.r 阅读全文
posted @ 2018-04-16 10:00 math98 阅读(178) 评论(0) 推荐(0) 编辑
Python实现进度条总结,倒计时
摘要:倒计时: import sys print('倒计时程序!') for i in range(10, -1, -1): mystr = '\r倒计时%s秒' % str(i) sys.stdout.write(mystr) sys.stdout.flush() time.sleep(1) 进度条,个 阅读全文
posted @ 2018-04-16 08:58 math98 阅读(737) 评论(0) 推荐(0) 编辑
引用其他py文件中的函数
摘要:有两种的实现方法,第一种有2个小的方法,第2个小方法比较正式 添加__init.py__ 说明 在想引用的文件所在目录下和想执行的py目录下,新建一个文件: __init.py__,即可通过 相对路径的方式引用 方法1 目录如下: a.py内容: b.py内容: 其他文件为空 和py_test同目录 阅读全文
posted @ 2018-04-11 10:33 math98 阅读(293) 评论(0) 推荐(0) 编辑
python中对list去重的多种方法
摘要:1.以下的几种情况结果是一样的,去重之后顺序会改变: 或用set 或使用itertools.grouby import itertools ids = [1,4,3,3,4,2,3,4,5,6,1] ids.sort() it = itertools.groupby(ids) for k, g in 阅读全文
posted @ 2018-04-11 10:09 math98 编辑
pyttsx3将文字转语音
摘要:import pyttsx3 engine = pyttsx3.init() engine.say("你好"); engine.setProperty('volume',0.9) engine.runAndWait() 阅读全文
posted @ 2018-04-11 00:36 math98 阅读(172) 评论(0) 推荐(0) 编辑
Python3中编码问题
摘要:html = r'{"code":404,"msg":"\u8be5\u8d44\u6e90\u4e0d\u5b58\u5728"}' print(html)# {"code":404,"msg":"\u8be5\u8d44\u6e90\u4e0d\u5b58\u5728"} print(html. 阅读全文
posted @ 2018-04-10 20:54 math98 阅读(743) 评论(0) 推荐(0) 编辑
Python中的join()函数的用法
摘要:1、str对象的join()函数 语法:'sep'.join(seq) 参数说明 sep:分隔符。可以为空 seq:要连接的元素:序列、字符串、元组、字典 例子: 2、os.path.join()函数 语法: os.path.join(path1[,path2[,......]]) 例子: 阅读全文
posted @ 2018-04-10 20:08 math98 编辑
python3实现文件下载的方法总结
摘要:从网上搜了下python实现文件下载的方法,总结如下,备查。 以下方法均已测试,环境win7 python3.6 方法一: 使用 urllib 模块提供的 urlretrieve() 函数。urlretrieve() 方法直接将远程数据下载到本地。 1 urlretrieve(url, [filen 阅读全文
posted @ 2018-04-10 19:33 math98 编辑
python自动发邮件库yagmail
摘要:转自:http://www.cnblogs.com/fnng/p/7967213.html 一般发邮件方法 我以前在通过Python实现自动化邮件功能的时候是这样的: 其实,这段代码也并不复杂,只要你理解使用过邮箱发送邮件,那么以下问题是你必须要考虑的: 你登录的邮箱帐号/密码 对方的邮箱帐号 邮件 阅读全文
posted @ 2018-04-10 17:22 math98 编辑
pandas_Excel_sqlite
摘要:to_sql(self, name, con, flavor, schema, if_exists, index, index_label, chunksize, dtype) 阅读全文
posted @ 2018-04-10 17:09 math98 编辑
python中schedule模块的使用
摘要:使用python进行job管理的schedule模块,简单好用,在这里记录一下。详细源码可以参考这里 https://github.com/dbader/schedule安装方法 pip install schedule 使用方法 运行该程序之后,可以定时的进行执行。除了代码中提到的方法之外,还有例 阅读全文
posted @ 2018-04-10 17:02 math98 编辑
修改Excel文件
摘要:1 import xlrd 2 from xlutils.copy import copy as copyWorkbook 3 from xlutils.filter import process, XLRDReader, XLWTWriter 4 def copy2(wb): 5 w = XLWTWriter() 6 process(XLRDReader(wb, '... 阅读全文
posted @ 2018-04-10 16:55 math98 编辑
selenium_126_cookie
摘要:1 from selenium import webdriver 2 from selenium.common.exceptions import TimeoutException 3 from selenium.webdriver.common.by import By 4 from selenium.webdriver.support.ui import WebDriverWait ... 阅读全文
posted @ 2018-04-10 16:52 math98 编辑
BeautifulSoup_lxml解析
摘要:CSS选择器 子串匹配 模糊匹配 select带有空格的class 阅读全文
posted @ 2018-04-10 10:16 math98 编辑