随笔分类 -  python记录

简短记录一些用python做的事情
摘要:python实现博客园自动上传图片 需要发表博客的时候,有些博客图片很多,要是一张一张手动上传,就太慢了,而且还很卡顿。 所以想着能不能自动上传来着。 网上找了一些方案,比如设置图床啥的,但是利用其他平台,总感觉不太方便。 本来试了试码云的,但是现在好像不能直接访问了。 最终还是决定,自己动手,丰衣 阅读全文
posted @ 2022-05-28 20:38 念秋 阅读(710) 评论(3) 推荐(0) 编辑
摘要:记录一下python爬取某编程网站 代码: 注释写得太多反而觉得很混乱。 新手,突发兴趣,递归下载网页内容,来学习一下python的常用操作。 以下代码不包含对图片之类的处理。 下载完成以后,放在nginx下跑,怎么也不能让代码像原网站一样上色,使用fiddler一分析,才发现少下载了一个js文件。 阅读全文
posted @ 2022-04-08 22:16 念秋 阅读(66) 评论(0) 推荐(0) 编辑
摘要:记录一次爬取空间表白墙的图片 有一说一,python是真的简单,网上的资源也很全。本人作为一个连循环都写不明白的小白,也能用python做到想到的事。 爬取图片,只是为了把图片转换为文字,然后找一条特定的说说而已。 首先是登录 此段代码参考至博客 需要自行设置phantomjs.exe的路径。还有就 阅读全文
posted @ 2022-03-20 08:32 念秋 阅读(939) 评论(0) 推荐(0) 编辑
摘要:本人的tesseract本来是3.0.2的,可以正常识别英文,但是添加简体中文识别库以后,一运行就报错。 找了很多错误答案,正解就是这个了。 参考自本篇博客 果然是版本过低,没什么需要注意的。 只是设置环境变量: TESSDATA_PREFIX C:\Program Files (x86)\Tess 阅读全文
posted @ 2022-03-19 17:20 念秋 阅读(703) 评论(0) 推荐(0) 编辑
摘要:简单记录一次python爬取某小说网站小说的操作 #!/usr/bin/python # -*- coding:utf-8 -*- import urllib.request import re # html = urllib.request.urlopen("https://xiaoshuo.ne 阅读全文
posted @ 2022-03-18 20:54 念秋 阅读(855) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示