摘要: 一、安装docker 参考官方文档:https://docs.docker.com/ 阿里云栖社区这篇安装docker CE的文章也很详细:https://yq.aliyun.com/articles/110806 二、使用docker加速器 官方镜像仓库在美国,在国内使用非常慢,甚至pull失败。 阅读全文
posted @ 2017-11-05 10:08 lplucky 阅读(264) 评论(0) 推荐(0) 编辑
摘要: 参考链接:http://www.cnblogs.com/suwings/p/6360395.html 做个爬虫真的是一波三折,今天爬取网站得到的返回内容是js的escape编码,完全乱码,用urllib.unquote()不行,decode再encode也不行。 上网查了下发现了这样做可以: 如图输 阅读全文
posted @ 2017-10-17 20:37 lplucky 阅读(649) 评论(0) 推荐(0) 编辑
摘要: 最近爬取一个网站的数据,有图片验证码,图片验证用的是百度ocr,但是百度ocr不支持gif图片的文字识别,所以需要将git图片转化为其他格式。 在这里我将gif图片转化为png格式。利用的是Python 的PIL(python image libiary)。 1、首先得安装python的PIL,我在 阅读全文
posted @ 2017-10-17 15:16 lplucky 阅读(1231) 评论(0) 推荐(0) 编辑
摘要: 注意:Excelt在解析时要看一下有没有多个sheet。该pdf解析只能解析文本内容的pdf 阅读全文
posted @ 2017-10-15 09:41 lplucky 阅读(513) 评论(0) 推荐(0) 编辑
摘要: 以下代码是某个项目中的一部分,无法直接使用。 1、需要有一个试图返回数据据(数据API) def dataYear(request): """ 统计所有数据的界面, 生成年份标签 """ year = request.GET['year'] table_type = request.GET['tab 阅读全文
posted @ 2017-10-10 13:05 lplucky 阅读(7450) 评论(0) 推荐(0) 编辑
摘要: #!/usr/bin/python # coding:utf8 import os import chardet import sys import traceback import logging # 遍历文件 def get_all_file_path(path, all_file_path): """ :param path: 指定的扫描路径 :param a... 阅读全文
posted @ 2017-10-10 12:51 lplucky 阅读(290) 评论(0) 推荐(0) 编辑
摘要: 原链接:http://www.cnblogs.com/dkblog/archive/2011/10/10/2205200.html 阅读全文
posted @ 2017-10-07 12:37 lplucky 阅读(243) 评论(0) 推荐(0) 编辑
摘要: google 开源项目风格指南:http://zh-google-styleguide.readthedocs.io/en/latest/ 参考:http://www.cnblogs.com/zhanglianbo/p/5664997.html 命名 module_name, package_nam 阅读全文
posted @ 2017-10-07 12:17 lplucky 阅读(222) 评论(0) 推荐(0) 编辑
摘要: 本文非原创,摘自:http://www.cnblogs.com/paulwinflo/p/5764748.html 可变参数 在Python函数中,还可以定义可变参数。顾名思义,可变参数就是传入的参数个数是可变的,可以是1个、2个到任意个,还可以是0个。 我们以数学题为例子,给定一组数字a,b,c… 阅读全文
posted @ 2017-10-07 11:32 lplucky 阅读(928) 评论(0) 推荐(0) 编辑
摘要: 习惯了chrome,用火狐真的很不习惯。 1、配置yum下载源: sudo vim /etc/yum.repos.d/google-chrome.repo 在目录 /etc/yum.repos.d/ 下新建文件 google-chrome.repo, 并且在该文件中添加如下内容: 2、sudo yu 阅读全文
posted @ 2017-10-05 22:26 lplucky 阅读(266) 评论(0) 推荐(0) 编辑