随笔 - 383
文章 - 0
评论 - 0
阅读 -
35125
10 2021 档案
Python实现PDF内容抽取PyMuPDF
摘要:最近需要把扫描的PDF转换成文本,试用了pdfminer,pypdf2等工具,解析图片的效果都不太好,用起来也比较麻烦,后来试用了PyMuPDF,相对其它工具,它最新版本屏蔽了更多细节,围绕Page进行操作,调用非常方便。除了PDF它还支持解析epub等电子书...
阅读全文
语义相似度模型SBERT ——一个挛生网络的优美范例
摘要:论文地址:https://arxiv.org/abs/1908.10084 论文中文翻译:https://www.cnblogs.com/gczr/p/12874409.html 源码下载:https://github.com/UKPLab/sentence-...
阅读全文
配置BERT运行环境
摘要:自然语言处理库Transformers包含了BERT、GPT、GPT-2、Transformer-XL、XLNet、XLM等模型的实现,近两年Pytorch生态日趋成熟。因此,本文中使用Transformers的Pytorch支持来调用BERT模型。 检查cu...
阅读全文