• 博客园logo
  • 会员
  • 周边
  • 新闻
  • 博问
  • 闪存
  • 众包
  • 赞助商
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录

intsig

合合信息技术团队
  • 博客园
  • 联系
  • 订阅
  • 管理

公告

随笔分类 -  表格识别

一个有效的图表图像数据提取框架
摘要:一个有效的图表图像数据提取框架建立了可以有效地处理各种图表数据,而不需要做出启发式的假设的鲁棒 Box detector 系统;提出了一种网络来测量图例匹配阶段图例和检测元素之间的特征相似性;提供了一个关于从信息图表中获取原始表格的 baseline,并发现了一些关键的因素来提高各个阶段并发现了一些关键的因素来提高各个阶段的性能。实验结果证明了该系统的有效性。 阅读全文

posted @ 2023-03-30 15:22 合合技术团队 阅读(322) 评论(0) 推荐(2)

表格识别与内容提炼技术理解及研发趋势
摘要:表格是各类文档中常见的对象,其结构化的组织形式方便人们进行信息理解和提取。表格的种类根据有无边框可以划分有线表、少线表、无线表。表格样式复杂多样,如存在背景填充、光照阴影、单元格行列合并等情况。大数据时代存在大量电子文档,应用表格识别技术能够减少表格处理时间,因此表格识别是文档理解领域的重要研究课题 阅读全文

posted @ 2023-02-01 15:43 合合技术团队 阅读(830) 评论(0) 推荐(0)

 
博客园  ©  2004-2026
浙公网安备 33010602011771号 浙ICP备2021040463号-3