gptpdf效果实测
环境配置
pip install gptpdf
测试代码
from gptpdf import parse_pdf
api_key = 'ollama'
pdf_path = '测试pdf.pdf'
base_url = 'http://localhost:11434/v1'
model = 'scomper/minicpm-v2.5'
output_dir = './out/'
content, image_paths = parse_pdf(pdf_path, api_key=api_key,base_url=base_url,model = model)
print(content)
效果
全是乱码,而且感觉就是prompt的回答,而且找了几个关键字说明根本没读出来
而且占用了16G显存
为啥不好?
原因推断是这个模型太小了,分辨率不够