摘要:
我们可能很少遇到需要判断图片类型的情况,因为通过扩展名一下子就判断出来了,但是从网上大量的下载图片,将它们作为机器学习的材料时,可能会遇到大量的图片只有数据没有扩展名的情况,为了将图片信息标准化,你就需要确定每一张图片数据的类型,到底是 jpg、png 还是 bmp 呢? 遇到这种状况,该怎么办呢? 阅读全文
摘要:
pdoc 是一个轻量级的库,专注于为 Python 项目生成 API 文档。 它通过扫描指定的模块和包,自动提取文档字符串,快速转化为易于浏览的 HTML 文档。这项技术尤其适用于需要快速生成文档的现代 Python 项目。 与市面上其他文档生成库例如 Sphinx 相比,pdoc 的特色在于其轻量 阅读全文
摘要:
00 — Loguru 库介绍 在编程世界里,日志记录是一项基础而重要的任务,它帮助我们理解软件的运行状态,监控问题,并进行故障排查。 然而,Python 的标准日志模块虽然功能强大,但对于初学者来说,配置过程可能既复杂又繁琐。 今天,我要介绍的是一个名为 Loguru 的 Python 库,它以简 阅读全文
摘要:
Github地址:https://github.com/xlwings/xlwings 在现代数据分析和报表生成中,Microsoft Excel仍然是一款非常流行和强大的工具。与此同时,Python作为一种高级编程语言,具备出色的数据处理和分析能力。那么,有没有一种方法可以将Excel和Pytho 阅读全文
摘要:
项目简介 文本隐水印,用来把一段信息嵌入到一段明文中,使信息隐密不可见,并且旁人无法察觉到嵌入后明文的变化。 经测试,在这些场景下信息隐藏比较完美 MacBook 版本的 Chrome 浏览器,包括知乎网页版、微博网页版等。 微信、钉钉。Mac/Iphone 版均可 苹果备忘录 用 Chrome 打 阅读全文
摘要:
项目简介 它是一个强大的多语言(97种语言)的混合文本自动分词工具。[中日英韩:已测试] 主要用途:它非常适合各种 TTS 语音合成项目,多语种混合文本的前端推理,和预处理后端训练。 它基于 py3langid 的扩展实现(>=python3.6)。 LangSegment It is a mult 阅读全文
摘要:
工作与学习中,有个场景需要判断指定日期是不是工作日,例如自动化办公工作日自动发邮件,量化交易判断是否为交易日等等, 因此我们需要能准确判断给的日期是不是工作日,Python中一般使用模块chinesecalendar来解决这个问题。 网友自己维护 from datetime import datet 阅读全文
摘要:
在之前开发windows应用程序时,为了实现一个注册码只能注册一台设备(只要不换机器一台电脑的设备序列号是唯一的),这时需要获取使用者电脑硬件的各种常见信息,如主板信息,cpu信息等,经过查询,模块vmi可以实现我的需求。 vim简介 WMI是一项核心的Windows管理技术,WMI作为一种规范和基 阅读全文
摘要:
https://github.com/ztane/python-Levenshtein/ 在处理文本数据时,我们经常需要比较两个字符串的相似度,无论是在自然语言处理、数据清洗还是用户输入验证中。这时,Levenshtein距离(又称编辑距离)就显得尤为重要。它衡量的是,将一个字符串转换成另一个字符串 阅读全文
摘要:
petl 是个啥? 如果你正在寻找一种简洁方便的方法来处理数据,那么 petl(Python ETL)值得你关注。 它的设计哲学就是简单易用,无论你是需要从 CSV 提取数据,还是想将 JSON 数据转换为表格形式,或者是对数据进行排序、过滤及聚合操作,petl都能够轻轻松松帮你搞定。 当然,市面上 阅读全文