20_api_intro_news_fetchcontentimages
获取任意链接正文图片
智能分析链接正文中的图片集合,解析任意链接,支持图片大小筛选。
1. 产品功能
- 根据提供的文章链接智能分析出文章正文中包含的图片列表;
- 支持传递图片大小以及图片分辨率条件对返回图片列表进行筛选;
- 接口可同时返回原始 HTML 内容,供您二次解析使用;
- 图片解析与标签处理基于机器学习;
- 全接口支持 HTTPS(TLS v1.0 / v1.1 / v1.2 / v1.3);
- 全面兼容 Apple ATS;
- 全国多节点 CDN 部署;
- 接口极速响应,多台服务器构建 API 接口负载均衡;
2. API 文档
API 详情地址: https://www.gugudata.com/api/details/fetchcontentimages
接口请求地址: https://api.gugudata.com/news/fetchcontentimages
返回格式: application/json; charset=utf-8
请求方式: POST
请求协议: HTTPS
请求示例: https://api.gugudata.com/news/fetchcontentimages
接口预览: https://www.gugudata.com/preview/fetchcontentimages
接口测试: https://api.gugudata.com/news/fetchcontentimages/demo
3. 请求参数
参数名 | 参数类型 | 是否必须 | 默认值 | 备注 |
---|---|---|---|---|
appkey | string | 是 | YOUR_APPKEY | 付费后获取的 APPKEY |
url | string | 是 | YOUR_VALUE | 需要抓取正文的文章链接 |
limittype | string | 否 | YOUR_VALUE | 对图片大小进行筛选条件类型,参数值为 size 或 ratio。size:按照图片大小 (KB) 进行筛选,ratio:按照图片分辨率 [宽,高] 进行筛选 |
limitvalue | float / [int,int] | 否 | YOUR_VALUE | 对图片大小进行筛选条件值,如果类型为 size,参数值格式为 float 类型的图片最小限制值(单位为 KB),如果类型为 ratio,参数值格式为 int 数组 [宽,高],分别限制最小宽与高(单位为像素) |
imagewithtag | bool | 否 | false | 是否返回获取到的图片原始 img HTML 标签 |
htmlsourcecontent | bool | 否 | false | 是否返回文章页面原始 HTML 内容,供您二次解析或分析正文图片列表失败时使用,需要注意接口的性能问题 |
4. 返回参数
参数名 | 参数类型 | 备注 |
---|---|---|
DataStatus.StatusCode | int | 接口返回状态码 |
DataStatus.StatusDescription | string | 接口返回状态说明 |
DataStatus.ResponseDateTime | string | 接口数据返回时间 |
DataStatus.DataTotalCount | int | 符合条件的图片集合数量 |
Data.Url | string | 文章 Url |
Data.ImagesUrl | string[] | 文章正文中符合筛选条件的图片 Url 集合 |
Data.ImagesTag | string[] | 当传递 imagewithtag 参数值为 true 时,返回获取到的图片原始 img HTML 标签 |
Data.HTMLSourceContent | string | 文章的原始 HTML 内容(HTML 标签为 Unicode 编码) |