Excalibur-PDF中提取表格数据

Excalibur: 一个用于从PDF中提取表格数据的Web界面,基于Camelot,采用Python 3开发。Excalibur仅适用于基于文本的PDF而不适用于扫描的文档,目前也不支持带交互的pdf
安装ghostscript

yum install ghostscript python3-tk

pip安装ghostscript

pip install excalibur-py

ImportError: libGL.so.1: cannot open shared object file

yum install mesa-libGL.x86_64

安装Excalibur

excalibur initdb

cat /root/excalibur/excalibur.cfg
vi /root/excalibur/excalibur.cfg
web_server_host = 0.0.0.0
wq

excalibur webserver
posted @ 2021-01-22 11:45  叨叨勋  阅读(95)  评论(0编辑  收藏  举报