NLP 中英文排版规范化 API 接口

NLP 中英文排版规范化 API 接口

接口详情官网地址: https://www.gugudata.com/api/details/formatarticle

NLP 中英文排版规范化 API 自动中英文排版、标点符号格式化,文本处理、NLP等关键词场景常会用到,适合用于中文文本处理与内容清洗、搜索分词与语言分析与知识抽取与文本理解等业务场景,方便开发者直接在应用、脚本或数据流程中接入。

gugudata_api_cover

1. 产品功能

  • 支持中英文混排格式化;
  • 自动在汉字与英文字符、英文标点、数字间添加空格;
  • 中文标点符号自动规范化,遵从 [标点符号用法 GB/T 15834 2011];
  • 无意义的全角标点以及英文字符、数字等自动修正;
  • 全接口支持 HTTPS(TLS v1.0 / v1.1 / v1.2 / v1.3);
  • 全面兼容 Apple ATS;
  • 全国多节点 CDN 部署;
  • 接口极速响应,多台服务器构建 API 接口负载均衡;

2. API 文档

接口地址: https://api.gugudata.com/text/formatarticle

返回格式: application/json; charset=utf-8

请求方式: POST

请求协议: HTTPS

请求示例: https://api.gugudata.com/text/formatarticle?appkey=YOUR_APPKEY&content=YOUR_VALUE

数据预览: https://www.gugudata.com/preview/formatarticle

接口测试: https://api.gugudata.com/text/formatarticle/demo

3. 请求参数

参数名 参数类型 是否必须 默认值 备注
appkey string YOUR_APPKEY 付费后获取的 APPKEY
content string YOUR_VALUE 需要格式化、规范化的内容

4. 返回参数

参数名 参数类型 备注
DataStatus.StatusCode int 接口返回状态码
DataStatus.StatusDescription string 接口返回状态说明
DataStatus.ResponseDateTime string 接口数据返回时间
DataStatus.DataTotalCount int 此条件下的总数据量,一般用于分页计算
Data.SourceContent string 格式化、规范化前的内容
Data.FormatContent string 格式化、规范化后的内容

5. 错误码说明

状态码 错误说明 备注
100 正常返回 -
101 参数错误 -
102 请求频率受限 每秒请求不能超过 100 次
103 账号欠费 -
104 APPKEY 错误 请检查传递的 APPKEY 是否为开发者中心获取到的值
110 接口响应错误 -

6. 适用场景

  • 适合用于中文文本处理与内容清洗,快速补齐产品侧需要的 NLP 中英文排版规范化 数据能力。
  • 适合用于搜索分词与语言分析,减少手工整理、清洗与重复开发成本。
  • 适合用于知识抽取与文本理解,将接口结果直接接入后台系统、数据任务或内容处理流程。

7. 相关接口

posted @ 2024-11-07 15:38  Parry  阅读(36)  评论(0)    收藏  举报