19_api_intro_news_fetchcontent
获取任意链接文章正文 API 接口
智能分析抓取链接中的正文部分
1. 产品功能
- 根据提供的文章链接智能分析出文章正文;
- 返回正文提供了纯文本和包含 HTML 标签两个模式;
- 数据抓取与文章标签处理基于机器学习;
- 全接口支持 HTTPS(TLS v1.0 / v1.1 / v1.2 / v1.3);
- 全面兼容 Apple ATS;
- 全国多节点 CDN 部署;
- 接口极速响应,多台服务器构建 API 接口负载均衡;
2. API 文档
API 详情地址: https://www.gugudata.com/api/details/fetchcontent
接口请求地址: https://api.gugudata.com/news/fetchcontent
返回格式: application/json; charset=utf-8
请求方式: POST
请求协议: HTTPS
请求示例: https://api.gugudata.com/news/fetchcontent
接口测试: https://api.gugudata.com/news/fetchcontent/demo
3. 请求参数
参数名 | 参数类型 | 是否必须 | 默认值 | 备注 |
---|---|---|---|---|
appkey | string | 是 | YOUR_APPKEY | 付费后获取的 APPKEY |
url | string | 是 | YOUR_VALUE | 需要抓取正文的文章链接 |
contentwithhtml | bool | 否 | false | 返回的文章是否包含 HTML 标签,默认为 false |
4. 返回参数
参数名 | 参数类型 | 备注 |
---|---|---|
DataStatus.StatusCode | int | 接口返回状态码 |
DataStatus.StatusDescription | string | 接口返回状态说明 |
DataStatus.ResponseDateTime | string | 接口数据返回时间 |
DataStatus.DataTotalCount | int | 此条件下的总数据量,此接口返回 1 |
Data.Url | string | 文章 Url |
Data.Title | string | 文章标题 |
Data.Content | string | 智能分析出的文章正文部分(包含 HTML 标签时,标签为 Unicode 编码) |
Data.PublishDate | string | 文章发表时间 |