PDF 转 HTML API 接口

PDF 转 HTML API 接口

接口详情官网地址: https://www.gugudata.com/api/details/pdf2html

PDF 转 HTML API 高效 PDF 转 HTML 工具,文件处理、PDF等关键词场景常会用到,适合用于文档识别与格式转换、批量归档与自动化录入与PDF、图片与网页内容处理等业务场景,方便开发者直接在应用、脚本或数据流程中接入。

gugudata_api_cover

1. 产品功能

  • 高效处理大文件;
  • 支持多语言字符识别;
  • 支持 formdata 格式 PDF 文件流传参;
  • 输出文件永久 CDN 存储;
  • 输出可直接访问的 HTML 站点;
  • 全面支持 HTTPS(TLS v1.0 / v1.1 / v1.2 / v1.3);
  • 兼容 Apple ATS;
  • 全国多节点 CDN 部署;
  • 多台服务器构建 API 接口负载均衡;

2. API 文档

接口地址: https://api.gugudata.com/imagerecognition/pdf2html?appkey={{appkey}}

返回格式: application/json; charset=utf-8

请求方式: POST

请求协议: HTTPS

请求示例: https://api.gugudata.com/imagerecognition/pdf2html?appkey={{appkey}}

数据预览: https://www.gugudata.com/preview/pdf2html

接口测试: https://api.gugudata.com/imagerecognition/pdf2html/demo

3. 请求参数

参数名 参数类型 是否必须 默认值 备注
file file YOUR_FILE formdata 文件流

4. 返回参数

参数名 参数类型 备注
DataStatus.StatusCode int 接口返回状态码
DataStatus.StatusDescription string 接口返回状态说明
DataStatus.ResponseDateTime string 接口数据返回时间
DataStatus.DataTotalCount int 此条件下的总数据量,一般用于分页计算
Data string 生成的 HTML 文件 CDN 地址

5. 错误码说明

状态码 错误说明 备注
100 正常返回 -
101 参数错误 -
102 请求频率受限 每秒请求不能超过 100 次
103 账号欠费 -
104 APPKEY 错误 请检查传递的 APPKEY 是否为开发者中心获取到的值
110 接口响应错误 -

6. 适用场景

  • 适合用于文档识别与格式转换,快速补齐产品侧需要的 PDF 转 HTML 数据能力。
  • 适合用于批量归档与自动化录入,减少手工整理、清洗与重复开发成本。
  • 适合用于PDF、图片与网页内容处理,将接口结果直接接入后台系统、数据任务或内容处理流程。

7. 相关接口

posted @ 2024-11-22 22:24  Parry  阅读(64)  评论(0)    收藏  举报