随笔 - 383  文章 - 0  评论 - 0  阅读 - 35125 
10 2021 档案
Python实现PDF内容抽取PyMuPDF
摘要:最近需要把扫描的PDF转换成文本,试用了pdfminer,pypdf2等工具,解析图片的效果都不太好,用起来也比较麻烦,后来试用了PyMuPDF,相对其它工具,它最新版本屏蔽了更多细节,围绕Page进行操作,调用非常方便。除了PDF它还支持解析epub等电子书... 阅读全文
posted @ 2021-10-13 14:58 xieyan0811 阅读(247) 评论(0) 推荐(0) 编辑
语义相似度模型SBERT ——一个挛生网络的优美范例
摘要:论文地址:https://arxiv.org/abs/1908.10084 论文中文翻译:https://www.cnblogs.com/gczr/p/12874409.html 源码下载:https://github.com/UKPLab/sentence-... 阅读全文
posted @ 2021-10-05 20:41 xieyan0811 阅读(352) 评论(0) 推荐(0) 编辑
配置BERT运行环境
摘要:自然语言处理库Transformers包含了BERT、GPT、GPT-2、Transformer-XL、XLNet、XLM等模型的实现,近两年Pytorch生态日趋成熟。因此,本文中使用Transformers的Pytorch支持来调用BERT模型。 检查cu... 阅读全文
posted @ 2021-10-05 20:39 xieyan0811 阅读(290) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示