PDF转文本 & 图片ORC - 在线App自动转 - 数据处理 (R)
在线转换PDF和图片文件
大数据处理的过程中,我们会遇到很多不同类型的数据,其中PDF和图片类文件最为常见,若需要整理这些类型的以便于后期数据分析或展示,而将它们输出成文本格式或关系型表格形式,会是个较好的选择。所以针对这个主题,制作了一个APP专门解决这两类文件格式的转换问题。如下是本地操作视频:
另外,此APP已部署到上线,有兴趣的盆友可以点击下面的连接试试:
https://aquamarine.shinyapps.io/OnlineTransferFiles/
登录网址后,将会看到这样的页面(和上述视频一样的界面):
线上版本有个小问题出现在图片文件的扫描读取上,对于训练集由于镜像中线上可用包的限制,会出现乱码。所以,线上版本图片文件的转换工作需要后续再调试,但使用的体验和本地版本是没有差别的。
记录有用的信息和数据,并分享!