随笔分类 - 爬虫

python之爬虫（爬取.ts文件并将其合并为.MP4文件——以及一些异常的注意事项）

摘要：//20200115 最近在看“咱们裸熊——we bears”第一季和第三季都看完了，单单就第二季死活找不到，只有腾讯有资源，但是要vip……而且还是国语版……所以就瞄上了一个视频网站——可以在线观看（好的动漫喜欢收藏，就想着下载，第一季第三季都找到了资源，甚至第四季都有，就没有第二季……）最近又阅读全文

posted @ 2020-01-15 22:00 醉生梦死_0423 阅读(6390) 评论(0) 推荐(1) 编辑

爬取杭电oj所有题目

摘要：杭电oj并没有反爬所以直接爬就好了直接贴源码（参数可改，循环次数可改，存储路径可改） import requests from bs4 import BeautifulSoup import time def write_in_file(number,string):#output functi 阅读全文

posted @ 2019-12-30 09:25 醉生梦死_0423 阅读(439) 评论(0) 推荐(0) 编辑

Python爬取微博热搜以及链接

摘要：基本操作，不再详述直接贴源码（根据当前时间创建文件）： import requests from bs4 import BeautifulSoup import time def input_to_file(number,time,str1): with open('D:\\python\\pyt 阅读全文

posted @ 2019-12-30 09:23 醉生梦死_0423 阅读(522) 评论(0) 推荐(0) 编辑

20191225_Python构造函数知识以及相关注意事项

摘要：Python构造函数格式为__init__() 注：下划线为两个而不是一个可以有无参构造 instance： class city: def printout(self,first,second): print(first+second) demo = city() demo.printout(1 阅读全文

posted @ 2019-12-25 14:45 醉生梦死_0423 阅读(248) 评论(0) 推荐(0) 编辑

爬虫_爬取有道每日一句

摘要：//emmmm爬虫使我快乐/捂脸 emmmm想在自己的网站上弄个每日一句，就写了个爬虫，写了一个半小时吧，网易还是有、东西的大致流程如下：先找到有道的官网网页-->点进去，F12-->刷新，查看network-->从上至下排查，找出可疑的包-->分析包-->编写程序-->json解析-->获取成阅读全文

posted @ 2019-06-05 15:49 醉生梦死_0423 阅读(652) 评论(0) 推荐(0) 编辑

java_爬虫_获取经过js渲染后的网页源码

摘要：md 弄了一天了……（这个月不会在摸爬虫了，浪费生命）进入正题: 起初是想写一个爬虫来爬一个网站的视频，但是怎么爬取都爬取不到，分析了下源代码之后，发现源代码中并没有视频的dom 但是在浏览器检查元素的时候又是有的，这就让我很难过了百度了一大天，发现是因为普通方法获取的只是服务器端本地的静态资源阅读全文

posted @ 2019-05-10 16:43 醉生梦死_0423 阅读(1820) 评论(0) 推荐(0) 编辑

公告

昵称：醉生梦死_0423
园龄： 6年4个月
粉丝： 6
关注： 4

+加关注

2025年3月

日

一

二

三

四

五

六

随笔分类 - 爬虫

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论