摘要:
1.挂载镜像 mount /dev/sr0 /dev/mnt/cdrom 2.从Packages 里面找到httpd打头的rpm包 3.逐个安装,先安装第一个httpd-2.4.6-90.el7.centos.x86_64.rpm 看一下所需的依赖包 第一个依赖 /etc/mime.types ht 阅读全文
摘要:
知识点: 1.urlencode的使用 2.md5加密方法 3.os的使用 4.json格式的get方法 遇到的问题: 1.返回的json数据为空:原因,没有添加headers和cookie import time import requests import urllib.parse def ge 阅读全文
摘要:
pip国内的一些镜像 阿里云 https://mirrors.aliyun.com/pypi/simple/ 中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/ 豆瓣(douban) http://pypi.douban.com/simple/ 清华大学 阅读全文
摘要:
总思路:抓包看需要发送什么数据,从fiddler抓到的包发现想要获得课程表的数据需要发送一个携带班级序号和学期号的GET请求,因为尝试了各种方法都无法直接通过请求进入网站,于是我把可能需要携带的数据都带进去,发现只需要一个User-Agent和Cookie这样事情就变得简单了,直接在字典中放入伪装头 阅读全文
摘要:
>>>"{} {}".format("hello", "world") # 不设置指定位置,按默认顺序 'hello world' >>> "{0} {1}".format("hello", "world") # 设置指定位置 'hello world' >>> "{1} {0} {1}".form 阅读全文
摘要:
import os for filename in os.listdir("班级名"): print(filename) with open("班级名/"+filename,encoding='utf-8') as f: for line in f.readlines(): with open("班 阅读全文
摘要:
出现该错误的原因是服务器开启了反爬虫,一般情况下只需要设置header模拟浏览器即可,但是urlretrieve并未提供header参数。 使用urlopen也可以直接下载文件,例 headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.3; Win6 阅读全文
摘要:
小试牛刀:爬取壁纸网的壁纸 今天偶然看到一个网站的壁纸很好看,于是想下载下来。可是每张图都要自己右键再下载,我觉得有点麻烦。于是尝试写了一个小程序来下载 基本思路:根据图片url然后使用urlretrieve方法来下载这些图片 由于这个网站是动态加载的,开始一直尝试了很多次,才知道只有抓包才能看到后 阅读全文