3月百度 AI 产品持续输出新功能,本期重点推荐:百度智能云曦灵正式发布“AI 手语平台”,四大功能重磅上线,构建听障人士的“有声桥梁”,同时还发布了“AI 手语平台一体机”,有效缓解无障碍窗口短缺困境;EasyDL 独家上线基于文心大模型 Ernie的“评论观点抽取”功能,更少数据更好效果,高效提取关键信息。
此外,AI 能力引擎多款产品功能升级,OCR 文字识别一体机全新发布;飞桨正式上线智能边缘控制台-多节点版,EasyDL 桌面版重磅推出 Notebook 集成开发环境;智能应用平台方向,本月正式发布曦灵数字员工运营平台;软硬一体解决方案中,百度联合生态伙伴发布机器人产品矩阵,并推出度目智能高效会议终端助手——AI 会议室门牌。接下来,让我们一起解锁更多产品新动态。
OCR
>> OCR 道路运输证识别,信息采集更快更安心【全新发布】
结构化识别横、竖版道路运输证,返回业户名称、地址、车辆号牌、车辆类型、吨(座)位等14个关键字段信息;针对拍摄角度异位、背景干扰、亮度干扰、内容错位等常见问题专项优化,识别准确率高。可应用于车辆年审、客运及货运站点报班管理等场景,快速采集营运车辆、从业人员身份信息,有效提升信息录入效率。
查看详情:
https://ai.baidu.com/tech/ocr_cars/road_transport_certificate
>> OCR 身份证混贴识别正式开售,低至8元/千次【正式商用】
身份证混贴识别可针对身份证正反面在同一张图片上的场景,自动检测识别身份证正反面所有字段,并可返回正反面边框位置信息;多档次数包火热开售,接口调用低至8元/千次。
查看详情:
https://ai.baidu.com/ai-doc/OCR/fk3h7xune#%E8%BA%AB%E4%BB%BD%E8%AF%81%E6%B7%B7%E8%B4%B4%E8%AF%86%E5%88%AB
>> 通用文字识别,扩展支持泰语、越南语、阿拉伯语等更多语言【能力升级】
通用文字识别(高精度版)、通用文字识别(高精度含位置版)全面升级!新增支持泰语、越南语、阿拉伯语、印第安语及部分少数民族语言,支持中、英、日、韩、法、西、葡、德、俄等20+种语言,接口调用低至7.6元/千次。
立即体验:
https://ai.baidu.com/tech/ocr/general
>> OCR 文字识别一体机【全新发布】
高精度 OCR 识别模型+多形态专用服务器,提供软硬一体、即插即用的本地 OCR 识别服务;在提升信息录入效率的同时,保证数据隐私安全。
产品系列:文档识别一体机、卡证识别一体机、票据识别一体机、OCR 训练平台一体机
功能优势:
-
全栈国产化适配:以飞桨为底座,全自主产权的高精度 OCR 模型,适配昆仑芯等主流国产化硬件及操作系统;
-
品类丰富、性能优越:支持桌面小型机、2U 机架、4U 机架,可定制硬件配置;原厂调试,充分利用硬件资源,保障模型达到最优性能;
-
采、用、保一站式:软硬件一体交付,开箱即用,更易集成;技术支持百度统一对接,硬件提供3年原厂维保。
典型应用场景:
-
档案录入及管理:机构/单位/企业的内部文档、事务登记表等,可集成入原有文档管理业务系统;
-
政务审批电子化:办事窗口、线上审批平台,识别各类个人身份证件、企业资质文件;
-
远程业务办理:远程开户、移动支付、线上投保等业务环节,自动提取个人/企业资质证照信息;
-
财税报销:各类税务发票、交通票据的电子化处理,代替人工录入和比对。
功能优势:
-
自动建模流程,零门槛上手:无需代码即可完成模型定制,快速构建评论分析系统,解决用户评论分析数据多/语序乱/难复用等业务难点;
-
更少标注数据,更优模型效果:仅需标注20多条文本数据信息,即可训练获得产业级AI模型,效果业界领先,助力业务快速落地;
-
自动预标注,更易用:基于大模型能力,实现数据的自动预标注,可自动识别出评论维度、评论观点与情感倾向,无需人工标注,标注效率提升70%。
典型应用场景:
-
产品反馈分析:帮助商家从新产品的用户评论中提取高价值信息,挖掘产品使用过程中的反馈,如使用体验、用户偏好等,及时迭代产品;
-
服务质量评测:多维度解析消费者对服务人员的评价,及时发现服务中的问题,量化评价服务质量,进而优化服务质量;
-
互联网舆情分析:帮助政府快速收集民众对于某项政策的多维度反馈,实时监控民众舆情,为下一步决策提供指导信息。
功能优势:
-
边缘资源集中纳管,业务统筹更便捷;
-
AI模型一键批量下发更新,降低模型部署成本;
-
视频流自动解析,可视化呈现模型效果,低成本便捷实现AI应用集成。
典型应用场景:
园区安防监控:异常行为检测/安全帽检测/工服检测等应用场景下,监控设备繁杂且需要统一管理,AI 检测模型同样需要定期更新管理,智能边缘控制台-多节点版可实现对多台监控设备的统一管理,助力 AI 应用落地。 智能生鲜电子秤: 电子秤的生鲜识别应用遍布各大超市,生鲜 SKU 迭代更新快,需要有统一资源管理和应用调度的平台进行业务落地,通过智能边缘控制台-多节点版可同时管理一个商超多个电子秤,高效实现模型更新和服务升级,实现降本增效。 查看详情:https://cloud.baidu.com/doc/EASYDL/s/sl138yv75 飞桨开源深度学习平台 >> 三行代码,一键预测,开箱即用的 NLP 一键预测功能全新升级【能力升级】 PaddleNLP 一键预测功能全新升级。用户通过调用 API,上传任务名称即可自动选择最优的预置模型,仅需三行代码即可完成推理。该功能自上线受到用户的一致好评,月均模型下载量达到1.9w。功能优势:
覆盖 NLP 11大场景:中文分词、词性标注、命名实体识别、句法分析、中文知识标注、文本纠错、文本相似度、情感分析、生成式问答、智能写诗、开放域对话。 产业级应用效果:在11大 NLP 场景中精度与预测性能 SOTA。比如,在分词任务上,F1-Score 达到 96%以上 ;在命名实体识别任务上,具备最全中文实体标签,且效果超过同类产品。功能优势:
-
支持10.36寸触摸屏设计,6mm 超薄一体化铝合金设计;
-
支持麦克风、喇叭、呼吸灯等设计;
-
支持刷脸签到、扫码签入、会议室状态查询、无线投屏、视频会议等功能;
-
500w 单目摄摄像头,从10Lux 到20000Lux,轻松应对暗光、无光、逆光等复杂环境;
-
支持10000张人脸底库,全流程检索速度小于0.3秒;
-
支持全年龄段检测,配备动态优化算法,越识别越精确;
-
默认搭配会议室预定系统,支持会议室管理、人员管理、智能 AIOT 控制等。
典型应用场景:
可作为会议室门牌和智能控制终端使用,适用于会议室、培训室、报告厅、办公室等多种场景。 查看详情:https://aim.baidu.com/product/e85c7c81-de68-4510-8e0e-1148cf61c0e2微信扫一扫
关注该公众号
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 展开说说关于C#中ORM框架的用法!