摘要: 1.挂载镜像 mount /dev/sr0 /dev/mnt/cdrom 2.从Packages 里面找到httpd打头的rpm包 3.逐个安装,先安装第一个httpd-2.4.6-90.el7.centos.x86_64.rpm 看一下所需的依赖包 第一个依赖 /etc/mime.types ht 阅读全文
posted @ 2020-02-22 11:29 学不会SLAM的 阅读(3296) 评论(2) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2020-02-14 21:36 学不会SLAM的 阅读(107) 评论(0) 推荐(0) 编辑
摘要: 知识点: 1.urlencode的使用 2.md5加密方法 3.os的使用 4.json格式的get方法 遇到的问题: 1.返回的json数据为空:原因,没有添加headers和cookie import time import requests import urllib.parse def ge 阅读全文
posted @ 2020-02-03 15:55 学不会SLAM的 阅读(940) 评论(0) 推荐(0) 编辑
摘要: pip国内的一些镜像 阿里云 https://mirrors.aliyun.com/pypi/simple/ 中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/ 豆瓣(douban) http://pypi.douban.com/simple/ 清华大学 阅读全文
posted @ 2020-02-01 13:48 学不会SLAM的 阅读(206) 评论(0) 推荐(0) 编辑
摘要: 总思路:抓包看需要发送什么数据,从fiddler抓到的包发现想要获得课程表的数据需要发送一个携带班级序号和学期号的GET请求,因为尝试了各种方法都无法直接通过请求进入网站,于是我把可能需要携带的数据都带进去,发现只需要一个User-Agent和Cookie这样事情就变得简单了,直接在字典中放入伪装头 阅读全文
posted @ 2020-01-27 16:42 学不会SLAM的 阅读(196) 评论(0) 推荐(0) 编辑
摘要: >>>"{} {}".format("hello", "world") # 不设置指定位置,按默认顺序 'hello world' >>> "{0} {1}".format("hello", "world") # 设置指定位置 'hello world' >>> "{1} {0} {1}".form 阅读全文
posted @ 2020-01-27 15:29 学不会SLAM的 阅读(125) 评论(0) 推荐(0) 编辑
摘要: import os for filename in os.listdir("班级名"): print(filename) with open("班级名/"+filename,encoding='utf-8') as f: for line in f.readlines(): with open("班 阅读全文
posted @ 2020-01-27 11:31 学不会SLAM的 阅读(2574) 评论(0) 推荐(1) 编辑
摘要: 出现该错误的原因是服务器开启了反爬虫,一般情况下只需要设置header模拟浏览器即可,但是urlretrieve并未提供header参数。 使用urlopen也可以直接下载文件,例 headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.3; Win6 阅读全文
posted @ 2020-01-17 16:27 学不会SLAM的 阅读(576) 评论(0) 推荐(0) 编辑
摘要: 小试牛刀:爬取壁纸网的壁纸 今天偶然看到一个网站的壁纸很好看,于是想下载下来。可是每张图都要自己右键再下载,我觉得有点麻烦。于是尝试写了一个小程序来下载 基本思路:根据图片url然后使用urlretrieve方法来下载这些图片 由于这个网站是动态加载的,开始一直尝试了很多次,才知道只有抓包才能看到后 阅读全文
posted @ 2020-01-17 16:24 学不会SLAM的 阅读(130) 评论(0) 推荐(0) 编辑
摘要: POST请求练习 通过爬取课程成绩我发现所有的班级名也可以爬取,只是需要提交一个表单,它长这样 既然知道了表单的内容,那我们可以通过urllib.parse.urlencode()方法把它封装到data里面去,访问的时候直接一起丢过去就可以了 page=1#可以自己写 data={'param_va 阅读全文
posted @ 2020-01-08 09:35 学不会SLAM的 阅读(134) 评论(0) 推荐(0) 编辑