随笔分类 -  爬虫

摘要://20200115 最近在看“咱们裸熊——we bears”第一季和第三季都看完了,单单就第二季死活找不到,只有腾讯有资源,但是要vip……而且还是国语版……所以就瞄上了一个视频网站——可以在线观看(好的动漫喜欢收藏,就想着下载,第一季第三季都找到了资源,甚至第四季都有,就没有第二季……) 最近又 阅读全文
posted @ 2020-01-15 22:00 醉生梦死_0423 阅读(6390) 评论(0) 推荐(1) 编辑
摘要:杭电oj并没有反爬 所以直接爬就好了 直接贴源码(参数可改,循环次数可改,存储路径可改) import requests from bs4 import BeautifulSoup import time def write_in_file(number,string):#output functi 阅读全文
posted @ 2019-12-30 09:25 醉生梦死_0423 阅读(439) 评论(0) 推荐(0) 编辑
摘要:基本操作,不再详述 直接贴源码(根据当前时间创建文件): import requests from bs4 import BeautifulSoup import time def input_to_file(number,time,str1): with open('D:\\python\\pyt 阅读全文
posted @ 2019-12-30 09:23 醉生梦死_0423 阅读(522) 评论(0) 推荐(0) 编辑
摘要:Python构造函数格式为__init__() 注:下划线为两个而不是一个 可以有无参构造 instance: class city: def printout(self,first,second): print(first+second) demo = city() demo.printout(1 阅读全文
posted @ 2019-12-25 14:45 醉生梦死_0423 阅读(248) 评论(0) 推荐(0) 编辑
摘要://emmmm爬虫使我快乐/捂脸 emmmm想在自己的网站上弄个每日一句,就写了个爬虫,写了一个半小时吧,网易还是有、东西的 大致流程如下: 先找到有道的官网网页-->点进去,F12-->刷新,查看network-->从上至下排查,找出可疑的包-->分析包-->编写程序-->json解析-->获取成 阅读全文
posted @ 2019-06-05 15:49 醉生梦死_0423 阅读(652) 评论(0) 推荐(0) 编辑
摘要:md 弄了一天了……(这个月不会在摸爬虫了,浪费生命) 进入正题: 起初是想写一个爬虫来爬一个网站的视频,但是怎么爬取都爬取不到,分析了下源代码之后,发现源代码中并没有视频的dom 但是在浏览器检查元素的时候又是有的,这就让我很难过了 百度了一大天,发现是因为普通方法获取的只是服务器端本地的静态资源 阅读全文
posted @ 2019-05-10 16:43 醉生梦死_0423 阅读(1820) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示