摘要: 整体思路: 下载文件并修改后缀为zip文件,解压zip文件,所要获取的内容在固定的文件夹下:work/temp/word/document.xml 所用包,全部是python自带,不需要额外下载安装. 阅读全文
posted @ 2018-10-30 17:09 python许三多 阅读(1966) 评论(0) 推荐(0) 编辑
摘要: 在项目开发中,总会遇到在原代码的基础上添加额外的功能模块,原有的代码也许是很久以前所写,为了添加新功能的代码块,您一般还得重新熟悉源代码,稍微搞清楚一点它的逻辑,这无疑是一件特别头疼的事情.今天我们介绍的python装饰器就能够很好的解决这类问题. 1.闭包函数 闭包比较简单,直接上代码 满足闭包的 阅读全文
posted @ 2018-10-25 14:18 python许三多 阅读(269) 评论(0) 推荐(0) 编辑
摘要: (2018-10-15)路2018骞�10鏈�16鏃�8:30鈥斺€�11:00锛屽湪鍏垽涓€搴叕寮€瀹$悊锛氬啀瀹$敵璇�..(2018-10-15)路2018骞�10鏈�16鏃�8:30鈥斺€�11:00锛屽湪鍏垽涓夊涵鍏紑瀹$悊锛氬啀瀹 阅读全文
posted @ 2018-10-22 11:15 python许三多 阅读(775) 评论(0) 推荐(0) 编辑
摘要: resp = My_Request_Get(xls_url) # My_Request_Get是我自己封装的请求函数,可修改为requests请求f = open('%s.xls' % _dic['title'], 'wb')f.write(resp.content)f.close()con_lis 阅读全文
posted @ 2018-10-17 09:38 python许三多 阅读(502) 评论(0) 推荐(0) 编辑
摘要: 在爬虫代码的编写中,requests请求网页的时候常常请求失败或错误,一般的操作是各种判断状态和超时,需要多次重试请求,这种情况下,如果想优雅的实现功能,可以学习下retrying包下的retry装饰器的使用 安装:pip install retrying 在@retry()装饰器中,比较重要的几个 阅读全文
posted @ 2018-10-16 11:24 python许三多 阅读(16739) 评论(0) 推荐(2) 编辑
摘要: import os import sys import time import subprocess def get_process_id(name): """查询进程ID""" child = subprocess.Popen(["pgrep","-f",name],stdout=subproce 阅读全文
posted @ 2018-09-19 15:34 python许三多 阅读(348) 评论(0) 推荐(0) 编辑
摘要: 由于公司任务紧迫,好久没有在园子里写自己的心得了,今天偷个闲发表点简单的代码块,在开源的时代贡献微薄力量.话不多说,直接上代码块: 函数getday()接收俩个参数:Y:要推前的时间的基础时间,例如你要在2018-05-25的基础上往前推天数 第二个参数:n:代表你要推前几天额整数 主要函数:dat 阅读全文
posted @ 2018-08-31 10:32 python许三多 阅读(440) 评论(0) 推荐(0) 编辑
摘要: 关键缩写和包导入 在这个速查手册中,我们使用如下缩写: df:任意的Pandas DataFrame对象 同时我们需要做如下的引入: import pandas as pd 导入数据 pd.read_csv(filename):从CSV文件导入数据pd.read_table(filename):从限 阅读全文
posted @ 2018-08-02 15:12 python许三多 阅读(3814) 评论(0) 推荐(0) 编辑
摘要: 在抓取下来的网页源码显示的是如下的内容,而不是可读性的汉字 经查资料后得知, 在网页中以四开头的是HTML实体,具体什么是HTML实体,请百度:http://baike.baidu.com/view/4757776.htm 如何把汉字转换成HTML实体呢? 其实很简单,汉字的HTML实体由三部分组成 阅读全文
posted @ 2018-07-20 17:06 python许三多 阅读(6273) 评论(1) 推荐(0) 编辑
摘要: SELECT DISTINCT 字段名称 FROM 表名称 阅读全文
posted @ 2018-07-17 17:29 python许三多 阅读(297) 评论(0) 推荐(0) 编辑