摘要:
今天有一个pdf文件处理需求,使用pdfplumber库完成,python环境是3.11+win10 pyinstaller 5.10.1 打包完成后,工具可以顺利打开,但是执行处理的时候报错 File "pypdfium2_raw\bindings.py", line 93, in <module 阅读全文
摘要:
最近整了台河北的HC2910,刷了ubuntu,刷机过程还是比较复杂的,特此记录下 首先说明下这个盒子的配置,CPU是华为海思的Hi3798Mv200,内存2G,8G存储,usb3.0 + usb2.0,2个网口,一个无线小板 这样的一个无线小板 首先开机,网线插wlan口,获取到ip后记录下来,后 阅读全文
摘要:
近期部署了一个项目,使用的是django开发,服务器是centos7,宝塔+python项目管理器 使用项目管理器新建项目,会自动配置虚拟环境,安装库,启动项目,非常不错方便 项目采用gunicorn方式部署,题高服务性能 部署后发现一个问题,日志那边看不到网站的日志,只有gunicorn的日志,网 阅读全文
摘要:
环境python3,win10,selenium=3.141.0 今天碰到一个问题,上传多个文件 一般来说网页上上传文件就是给input标签send_keys(文件绝对路径) 但是如果是上传多个文件,则需要修改下,参考网页上的说法是将地址用\n拼接起来然后send_keys() import os 阅读全文
摘要:
如果在colab进行炼丹,数据集上传是个头疼的问题,稍微大一点的数据,传到谷歌云盘或者colab都是很慢的速度 本地测试上传要给500m的数据到谷歌云盘,需要50分钟 这里分享一个方法,先上传到onedriver,然后colab去下载分享文件 先把文件上传到onedriver,免费用户提供5g空间, 阅读全文
摘要:
最近公司需要做深度学习,无奈自己笔记本是什么m2000m,2g显存,查了下,和gtx970差不多水准,这显卡,拿来跑稍微大一点的模型都会爆显存 经过一番查询,发现谷歌提供免费的gpu供深度学习使用,免费用户最长12小时连续运行,超过就会回收 进过一番操作,进入了谷歌的colab,首先看下配置信息,给 阅读全文
摘要:
最近接了个活,有大批的图片需要文字识别 图片参考 是印刷字体打印后再扫描的图片,看到这种任务,首先想到的是用tesseract进行识别,印刷字体识别率很高 拿出工具进行识别分析,效果感人,5段文字,有3段都有识别错的,2和Z,3和S 进过多个图片测试,基本不可用,识别错的太多了 对接百度通用识别,使 阅读全文
摘要:
一般来说,用selenium是无法获取ajax请求内容的,不过最近了解到有个工具ajax-hook,通过hook浏览器xhr请求来获取抓包数据 目前方案有 1.ajax+flask 将ajaxhook到的数据发送到flask服务器上面,后期再去flask上面获取到请求数据 hook.js //需要引 阅读全文
摘要:
写autojs也蛮久了,但是一直有个问题困扰我,之前一直没有深入研究,也是自己太菜了 就是启动app,app.launchApp("QQ"),这个命令,这个命令具体表现就是有时候会失效,无法启动app 执行命令无任何反应,这个对于需要切换多个app的脚本,无法启动app这个几乎致命 下面是测试的界面 阅读全文
摘要:
如果用selenium时间比较长的话,总会碰到chrome版本和chromedriver版本不匹配问题 这个报错相信大家不少见,这个问题就是因为chromedriver现在和chrome大版本保持一致,否则就启动不了, 而chrome又是常常更新,还是自动的。 做好的脚本,发给客户后,过一段时间客户 阅读全文