上一页 1 2 3 4 5 6 7 8 ··· 18 下一页

2022年7月30日

epub转mobi方法

摘要: git上找到一个文章,转载一下。优化省略了一些内容,毕竟不是长期转。 https://github.com/GHLiu1993/EpubToMobi 只说windows的吧。mac的可以直接看原文。 首先,上亚马逊下载 Kindle-Previewer https://www.amazon.com/ 阅读全文

posted @ 2022-07-30 11:35 耀扬 阅读(703) 评论(0) 推荐(0) 编辑

2022年7月19日

python提取pdf文字包括直接解析和ocr两种方式

摘要: 1、可以直接提取的pdf from io import StringIO from io import open from pdfminer.converter import TextConverter from pdfminer.layout import LAParams from pdfmin 阅读全文

posted @ 2022-07-19 15:35 耀扬 阅读(2735) 评论(0) 推荐(0) 编辑

2022年7月18日

python读取文件名

摘要: xx=os.path.splitext(r'C:\Users\mydell\Desktop\mypdfocr\123.pdf') print(xx[0].split('\\')[-1]) 阅读全文

posted @ 2022-07-18 17:11 耀扬 阅读(93) 评论(0) 推荐(0) 编辑

'Document' object has no attribute 'pageCount',_writeIMG() missing 1 required positional argument: 'format'问题

摘要: python中想用fitz库,把pdf转为图片。 网上找了资料发现。均报错 'Document' object has no attribute 'pageCount' 没啥 肯定是库升级了,函数改名了。 首先 考虑 使用 dir() 方法查找一下该对象的所有的属性和方法 果然改名了 # 安装fit 阅读全文

posted @ 2022-07-18 16:55 耀扬 阅读(7306) 评论(0) 推荐(0) 编辑

2022年6月23日

百度搜索黑技巧-不现实哪些网站的内容

摘要: 经常用搜索引擎检索技术资料,非常讨厌百度文库和CSDN。总是要收费巴拉巴拉的,复制、下载也受限制。基本和广告也差不多了。 告诉大家一个使用方法 例如: 输入关键词 “mysql 存储过程 -csdn -百度文库” 垃圾就清除了 阅读全文

posted @ 2022-06-23 11:15 耀扬 阅读(38) 评论(0) 推荐(0) 编辑

2022年6月16日

[CLS],[SEP],[PAD] 解释

摘要: [CLS]作为起始符,[SEP]作为两句句子的中间隔离符。[PAD]标记在整个序列的最末尾 阅读全文

posted @ 2022-06-16 15:48 耀扬 阅读(613) 评论(0) 推荐(0) 编辑

2022年6月15日

进化论的解释

摘要: 进化论提出“物竞天择,适者生存”。最重要的是 自然选择 理论 什么是自然选择? 需要两个条件: 1、你能够生存(活下来)的能力! 2、你能够繁殖(生小孩)的能力! 具备了这两个条件,你就具备了能够被大自然选择的条件了。 例如孔雀,能在斗争中生存下来,能够获得足够的食物,并且,还有时间通过艳丽竞争到交 阅读全文

posted @ 2022-06-15 17:56 耀扬 阅读(264) 评论(0) 推荐(0) 编辑

2022年6月8日

centos安装anaconda教程

摘要: 1.更新yum 命令: sudo yum update 2、安装anaconda 2.1 查看anaconda对应python版本 我选的3.8版 https://docs.anaconda.com/anaconda/packages/oldpkglists/ 2.2 进入 清华镜像 https:/ 阅读全文

posted @ 2022-06-08 12:40 耀扬 阅读(1327) 评论(0) 推荐(0) 编辑

2022年6月4日

python操作CSV

摘要: 使用csv.reader读取数据 import csv # 以读方式打开文件 with open("data.csv", mode="r", encoding="utf-8-sig") as f: # 基于打开的文件,创建csv.reader实例 reader = csv.reader(f) # 获 阅读全文

posted @ 2022-06-04 11:51 耀扬 阅读(279) 评论(0) 推荐(0) 编辑

2022年6月3日

networkx无法显示中文

摘要: 修改matplotlibrc文件 font.family : sans-serif #打开该选项 #打开该选项 font.sans-serif : Microsoft YaHei , Bitstream Vera Sans, Lucida Grande, Verdana, Geneva, Lucid 阅读全文

posted @ 2022-06-03 23:24 耀扬 阅读(412) 评论(0) 推荐(0) 编辑

2022年6月1日

jupyter Notebook 三方库常用功能

摘要: 以下操作直接在notebook里面写 即可 1、查看库版本 numpy.__version__ 2、如果看到 no module 直接 pip install numpy 3、升级三方库 pip install numpy --upgrade 阅读全文

posted @ 2022-06-01 12:10 耀扬 阅读(341) 评论(0) 推荐(0) 编辑

2022年5月31日

pyLDAvis图表无法打开

摘要: 利用pyLDAvis研究LDA模型。 遇到了两个问题 1、代码老旧,代码如下: 提示错误,这是pyLDAvis版本升级导致的。 No module named ‘pyLDAvis.gensim’ 改成如下: import pyLDAvis.gensim_models pyLDAvis.enable_ 阅读全文

posted @ 2022-05-31 20:38 耀扬 阅读(802) 评论(0) 推荐(0) 编辑

2022年5月20日

飞浆paddleocr识别

摘要: 1 安装 PaddlePaddle 有显卡的: python3 -m pip install paddlepaddle-gpu 没显卡的: python3 -m pip install paddlepaddle 1.2 安装PaddleOCR Whl包 pip install paddleocr 调 阅读全文

posted @ 2022-05-20 16:15 耀扬 阅读(536) 评论(0) 推荐(0) 编辑

mysql去重、多列去重

摘要: MySQL 数据去重可是 MySQL 必会技能之一。比如,在数据库中找出使用相同 email 但不同 username 的用户等应用场景。 本教程将介绍 4 种删除重复数据的方法。SELECT DISTINCT、GROUP BY 、INNER JOIN 、ROW_NUMBER() ,它们各有各的特点 阅读全文

posted @ 2022-05-20 13:31 耀扬 阅读(5877) 评论(0) 推荐(0) 编辑

2022年5月5日

正向代理与反向代理

摘要: 正向代理是一个位于客户端和原始服务器之间的服务器,为了从原始服务器取得内容,客户端向代理发送一个请求并指定原始服务器,然后代理向原始服务器转交请求并将获得的内容返回给客户端。代理服务器和客户端处于同一个局域网内。 比如说fanqiang。我知道我要访问谷歌,于是我就告诉代理服务器让它帮我转发。 反向 阅读全文

posted @ 2022-05-05 14:20 耀扬 阅读(49) 评论(0) 推荐(0) 编辑

上一页 1 2 3 4 5 6 7 8 ··· 18 下一页

导航