05 2020 档案
摘要:os.rename() 方法用于命名文件或目录,从 src 到 dst,如果dst是一个存在的目录, 将抛出OSError。 语法 os.rename(src, dst) 参数 src -- 要修改的目录名 dst -- 修改后的目录名 实例 before rename: Out[3]: ['/Us
阅读全文
摘要:完整的 mime type 列表 转载地址:http://www.sitepoint.com/web-foundations/mime-types-complete-list/ 附件上传参考
阅读全文
摘要:有没有被网页编码抓狂,怎么转都是乱码。 通过查看requests源代码,才发现是库本身历史原因造成的。 作者是严格http协议标准写这个库的,《HTTP权威指南》里第16章国际化里提到,如果HTTP响应中Content-Type字段没有指定charset,则默认页面是'ISO-8859-1'编码。
阅读全文
摘要:普通的搜索引擎,没有隐私增强功能。 您的隐私真的很重要,这些私人搜索引擎可以帮助您保持在线私密: 1.Search Encrypt Search Encrypt 使用本地加密来保护您的搜索。它结合了AES-256加密和安全套接字层加密。搜索加密然后从其搜索合作伙伴网络中检索您的搜索结果。完成搜索后,
阅读全文
摘要:详见 https://www.zhihu.com/question/60153484
阅读全文
摘要:新建一个txt文件,输入以下内容: taskkill /F IM wechat.exe start "" "D:\wechat\WeChat\WeChat.exe" # 打开第一个 start "" "D:\wechat\WeChat\WeChat.exe" # 打开第二个 ……多个直接重复上面代码
阅读全文
摘要:https://blog.csdn.net/qq_43404784/article/details/88994350 https://www.runoob.com/python/python-os-path.html
阅读全文
摘要:编辑模式快捷键( 按 Enter 键启动): 快捷键作用说明 Tab 代码补全或缩进 Command-] 缩进 向右缩进 Command-[ 解除缩进 向左缩进 Command-A 全选 Command-Z 撤销 Command-Up 跳到单元开头 Command-End 跳到单元末尾 Comman
阅读全文
摘要:http://one.newday.me/ https://greasyfork.org/zh-CN/users/247205-newday-me 某走运 https://simplekeji.lanzous.com/b0c2c4s2b
阅读全文
摘要:最近看了某公众号文章,推荐了所谓的神器,据说读取速度吊打pandas,可谓牛逼。 抱着学习的精神,网上搜了文章,发现了一些端倪,事实真是这样吗?来一起揭秘真相。 首先安装包 # pip install ray # pip install dask # pip install modin 安装版本 S
阅读全文
摘要:使用Selenium时,卡在唤起Chrome,原来Chrome偷偷更新,导致版本没对应上,正常唤起Chrome SessionNotCreatedException: Message: session not created: This version of ChromeDriver only su
阅读全文
摘要:曾经微信公众号是了解局势的便捷媒介, 如今已成为各大公众号作秀现场,收割一波又一波不明真相的吃瓜群众, 今天把部分关注过的公众号取消关注,顺手整理标题关键词,欢迎补充 隐藏 偷偷 老死机 神秘破例 牛掰 重要 最强 最新 秒播 福利 海量 绝版 18 禁止 限时 删除 到爆 保留 资源 自查 太猛
阅读全文
摘要:做自动化突然冒出错误:SessionNotCreatedException: session not created: This version of ChromeDriver only supports Chrome version 81 版本偷偷更新了,OMG!!! 正确姿势一 首先关闭Chro
阅读全文
摘要:https://blog.csdn.net/wuqing942274053/article/details/80427259
阅读全文
摘要:[转]scrapy中的request.meta
阅读全文
摘要:https://www.cnblogs.com/dengyanchuan/p/11123129.html
阅读全文
摘要:https://blog.csdn.net/toshibahuai/article/details/79034829
阅读全文
摘要:登录网址(支持微信扫描,需公众号绑定微信) https://account.chsi.com.cn/passport/login?service=https%3A%2F%2Fmy.chsi.com.cn%2Farchive%2Fj_spring_cas_security_check 在线验证报告(1
阅读全文
摘要:下面失效 https://blog.csdn.net/gs6511/article/details/62418422
阅读全文
摘要:三行代码解决Mac升级弹窗,小红点数字1 很遗憾告诉各位,屏蔽不了 不过每天设置明天提醒
阅读全文
摘要:https://blog.csdn.net/q_an1314/article/details/51111958
阅读全文
摘要:scrapy基础知识之发送POST请求与使用 FormRequest.from_response() 方法模拟登陆 https://blog.csdn.net/qq_33472765/article/details/80958820 scrapy框架中的Request()、FormRequest()
阅读全文
摘要:scrapy.cmdline.execute scrapy的cmdline命令 1.启动爬虫的命令为:scrapy crawl (爬虫名) 2.还可以通过以下方式来启动爬虫 方法一:创建一个.py文件(这里的爬虫文件名可以自己定义,例:myspider.py) # -*- coding:utf-8
阅读全文
摘要:https://pan.baidu.com/component/view?id=455 https://pan.baidu.com/union/smartProgramShare?scheme=bdnetdisk://n/action.EXTERNAL_ACTIVITY?type=invitatio
阅读全文
摘要:runspider:不依赖创建项目 命令:scrapy runspider myspider.py 等同于 pyhton myspider.py crawl:使用spider进行爬取,依赖项目创建 命令:scrapy crawl myspider 更多命令行工具:https://scrapy-chs
阅读全文
摘要:一个工程生产一个spider,也可以多个spider,比如一个爬文本,一个爬图片等 cd tutorial #自己创建的工程目录 scrapy genspider test1 test1.com scrapy genspider test2 test2.com 用scrapy list查看三个(早期
阅读全文
摘要:比如我们要调试某网页:https://g.widora.cn/ shell不依赖工程环境 scrapy shell https://g.widora.cn/ 类似页面F12,可用对象都列出来了,一般常用response 前面省略 2020-05-08 21:07:18 [asyncio] DEBUG
阅读全文
摘要:数据清洗必备技能 https://www.cnblogs.com/yaner2018/p/11162630.html
阅读全文
摘要:原文: https://blog.csdn.net/qq_36936730/article/details/105132550
阅读全文
摘要:(1) settings.py 取消注释:COOKIES_ENABLED = True (2)爬虫xx.py def parse(self, response): c_dic = {自己抓包} # 获取cookies xxx自己写原始页面xxx yield scrapy.Request(url,co
阅读全文
摘要:items.py class LianhezaobaospyderItem(scrapy.Item): # define the fields for your item here like: # name = scrapy.Field() # pass body=scrapy.Field() li
阅读全文
摘要:Scrapy Day01 (1) 进入主目录,右键打开终端,创建项目 scrapy startproject xicidailiSpyder 进入项目目录 cd xicidailiSpyder/ 创建爬虫文件(文件名不能与项目名相同) scrapy genspider xicidaili www.x
阅读全文