• 博客园logo
  • 会员
  • 周边
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录

intsig

合合信息技术团队
  • 博客园
  • 联系
  • 订阅
  • 管理

公告

1 2 3 4 5 ··· 22 下一页

[置顶] 文本纠错:提升OCR任务准确率的方法理解

摘要: 错字率是OCR任务中的重要指标,文本纠错需要机器具备人类水平相当的语言理解能力。随着人工智能应用的成熟,越来越多的纠错方法被提出。 近年来深度学习在OCR领域取得了巨大的成功,但OCR应用中识别错误时有出现。错误的识别结果不仅难以阅读和理解,同时也降低文本的信息价值。在某些领域,如医疗行业,识别错误可能带来巨大的损失。因此如何降低OCR任务的错字率受到学术界和工业界的广泛关注。合合信息通过本文来讲解文本纠错技术帮助更多人解决业务问题。通常文本纠错的流程可以分为错误文本识别、候选词生成和候选词排序三个步骤。文本纠错方法可包括基于CTC解码和使用模型两种方式,下面分别对这两种纠错方式进行介绍。 阅读全文

posted @ 2023-01-31 11:26 合合技术团队 阅读(483) 评论(0) 推荐(0)

2025年6月24日

启信宝联合六大数交所共同编制,《企业数据治理实践白皮书》发布

摘要: 启信宝联合六大数交所共同编制,《企业数据治理实践白皮书》发布 近期,第三届粤港澳大湾区国际数据交易周在深圳举办。本届活动由深圳数据交易所主办,以“数聚湾区,智启新程”为主题,聚焦数据要素市场化配置改革、数据跨境流通及数据资产化等前沿议题。会上,合合信息旗下启信宝正式发布了《企业数据治理实践白皮书》(下文称“白皮书”)。 据悉,该白皮书由启信宝联合中国科学院大学 阅读全文

posted @ 2025-06-24 15:03 合合技术团队 阅读(8) 评论(0) 推荐(0)

2025年6月20日

合合信息发布业内首个AI Agent跨平台云资源智能管理终端

摘要: 合合信息发布业内首个AI Agent跨平台云资源智能管理终端 近期,上海合合信息科技股份有限公司发布了业内首个AI Agent跨平台云资源智能管理终端Chaterm,通过打造“对话式终端管理工具”,帮助云计算从业人士实现云资源的智能化和规模化管理。目前,该产品核心代码已全面开源。 阅读全文

posted @ 2025-06-20 10:45 合合技术团队 阅读(23) 评论(0) 推荐(0)

2025年6月18日

中高考季,盘点AI文档工具有哪些实用的创新?

摘要: 中高考季,盘点AI文档工具有哪些实用的创新? 本文讨论了中高考季背景下,AI 文档工具 TextIn 在学习领域的新功能创新。 阅读全文

posted @ 2025-06-18 10:49 合合技术团队 阅读(5) 评论(0) 推荐(0)

2025年6月16日

《启信宝2025奶茶趣味报告》:奶茶企业5年激增140%,增至近40万家

摘要: 《启信宝2025奶茶趣味报告》:奶茶企业5年激增140%,增至近40万家 近日,启信宝基于商业查询技术,对相关企业进行智能分析,最新发布了《2025奶茶趣味报告》,用数据揭开了奶茶千亿市场的真实面貌。 阅读全文

posted @ 2025-06-16 14:44 合合技术团队 阅读(17) 评论(0) 推荐(0)

2025年6月11日

真实场景文档理解:字节发布的WildDoc基准数据集向OCR提出了什么挑战?

摘要: 真实场景文档理解:字节发布的WildDoc基准数据集向OCR提出了什么挑战? 本文讨论了字节跳动团队联合华中科技大学发布的 WildDoc 基准数据集对 OCR 能力的再衡量,分析了现有模型在真实场景文档理解中的性能瓶颈,探讨了自然场景文档解析的重要性及文档解析产品的应对方法。 阅读全文

posted @ 2025-06-11 10:59 合合技术团队 阅读(12) 评论(0) 推荐(0)

2025年6月9日

从OCR到Document Parsing,AI时代的非结构化数据处理发生了什么改变?

摘要: 从OCR到Document Parsing,AI时代的非结构化数据处理发生了什么改变? 本文讨论了在AI时代,非结构化数据处理从OCR到Document Parsing的改变,介绍了文档解析技术的概念、作用、典型应用等内容。 阅读全文

posted @ 2025-06-09 11:12 合合技术团队 阅读(24) 评论(0) 推荐(0)

2025年6月3日

TextIn OCR Frontend前端开源组件库发布!

摘要: TextIn OCR Frontend前端开源组件库发布! 本文讨论了TextIn团队开源OCR Frontend前端组件库的相关事宜,包括开源原因、组件库特性、安装使用方法、组件说明、API定义、示例及二次开发等内容。 阅读全文

posted @ 2025-06-03 19:46 合合技术团队 阅读(12) 评论(0) 推荐(0)

2025年5月30日

合合信息首批通过中国信通院文档图像篡改检测平台能力完备性测评

摘要: 合合信息首批通过中国信通院文档图像篡改检测平台能力完备性测评 在中国信通院最新开展的文档图像篡改检测平台能力完备性测评中,合合信息旗下TextIn通用篡改检测平台首批通过测试,体现了公司在图像篡改检测技术领域的领先水平。 阅读全文

posted @ 2025-05-30 11:53 合合技术团队 阅读(8) 评论(0) 推荐(0)

论文解读 - 统一的多模态理解和生成模型综述(下)

摘要: 论文解读 - 统一的多模态理解和生成模型综述(下) 文章综述统一多模态理解和生成模型,介绍多模态理解与文本到图像生成模型进展,将统一模型分为扩散、自回归、混合三类,分析结构设计,还提及数据集、基准及令牌策略等挑战与机遇。 阅读全文

posted @ 2025-05-30 11:09 合合技术团队 阅读(43) 评论(0) 推荐(0)

2025年5月29日

论文解读 - 统一的多模态理解和生成模型综述(上)

摘要: 论文解读 - 统一的多模态理解和生成模型综述(上) 文章综述统一多模态理解和生成模型,介绍多模态理解与文本到图像生成模型进展,将统一模型分为扩散、自回归、混合三类,分析结构设计,还提及数据集、基准及令牌策略等挑战与机遇。 阅读全文

posted @ 2025-05-29 11:12 合合技术团队 阅读(66) 评论(0) 推荐(0)

1 2 3 4 5 ··· 22 下一页
 
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3