• 博客园logo
  • 会员
  • 周边
  • 新闻
  • 博问
  • 闪存
  • 众包
  • 赞助商
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录

intsig

合合信息技术团队
  • 博客园
  • 联系
  • 订阅
  • 管理

公告

05 2023 档案

合合信息商业大数据技术为农商行打造数字化转型专项方案
摘要:合合信息商业大数据技术为农商行打造数字化转型专项方案为帮助农商行更加系统、高效地进行客户拓展、风险控制,合合信息旗下启信宝企业端产品“启信慧眼”近期发布了“农商行数字化转型方案”,用“网格化营销”帮助银行精准获客,助力农商行加速数字化转型进程,更好地服务广大小微企业。 阅读全文

posted @ 2023-05-31 16:10 合合技术团队 阅读(42) 评论(0) 推荐(0)

常用的表格检测识别方法——表格结构识别方法(上)
摘要:常用的表格检测识别方法——表格结构识别方法(上)表格结构识别是表格区域检测之后的任务,其目标是识别出表格的布局结构、层次结构等,将表格视觉信息转换成可重建表格的结构描述信息。这些表格结构描述信息包括:单元格的具体位置、单元格之间的关系、单元格的行列位置等。在当前的研究中,表格结构信息主要包括以下两类描述形式:1)单元格的列表(包含每个单元格的位置、单元格 的行列信息、单元格的内容);2)HTML代码或Latex代码(包含单元格的位置信息,有些也会包含单元格的内容)。 阅读全文

posted @ 2023-05-24 10:24 合合技术团队 阅读(463) 评论(0) 推荐(0)

常用的表格检测识别方法 - 表格区域检测方法(下)
摘要:常用的表格检测识别方法 - 表格区域检测方法(下)本文介绍了一种利用可变形transformer对文档图像进行表格检测的半监督方法。该方法通过将伪标签生成框架集成到一个简化的机制中,减轻了对大规模注释数据的需要,并简化了该过程。同时生成伪标签产生了一个被称为“飞轮效应”的动态过程,随着训练的进行,一个模型不断改进另一个模型产生的伪边框。在该框架中,使用两个不同的模块学生和教师,对伪类标签和伪边界框进行了改进。这些模块通过EMA功能相互更新,以提供精确的分类和边界框预测。结果表明,当应用于TableBank和PubLayNet训练数据的10%、30%和50%时,该方法的性能超过了监督模型的性能。此外,当对PubLayNet的10%标记数据进行训练时,该模型的性能与当前基于cnn的半监督基线相比较。在未来,作者的目标是研究标记数据的比例对最终性能的影响,并开发出以最小数量的标记数据有效运行的模型。此外,作者还打算采用基于transformer的半监督学习机制来进行表结构识别任务。 阅读全文

posted @ 2023-05-19 11:08 合合技术团队 阅读(437) 评论(1) 推荐(1)

常用的表格检测识别方法-表格区域检测方法(上)
摘要:常用的表格检测识别方法-表格区域检测方法(上)表格检测识别一般分为三个子任务:表格区域检测、表格结构识别和表格内容识别。本章将围绕这三个表格识别子任务,从传统方法、深度学习方法等方面,综述该领域国内国外的发展历史和最新进展,并提供几个先进的模型方法。 阅读全文

posted @ 2023-05-18 12:19 合合技术团队 阅读(715) 评论(0) 推荐(0)

合合信息亮相CCIG2023:多位大咖共话智能文档未来,文档图像内容安全还面临哪些技术难题?
摘要:合合信息亮相CCIG2023:多位大咖共话智能文档未来,文档图像内容安全还面临哪些技术难题?近日,中国图象图形大会(CCIG 2023)(简称“大会”)在苏州圆满落幕。本届大会以“图象图形·向未来”为主题,由中国科学技术协会指导,中国图象图形学学会主办,苏州科技大学承办,特邀谭铁牛院士、赵沁平院士、吴一戎院士等百余位国内外知名学者,来自代表企业的技术专家,共话图像图形学术研究与技术创新趋势,共谋行业新发展。 阅读全文

posted @ 2023-05-17 15:24 合合技术团队 阅读(183) 评论(0) 推荐(0)

 
博客园  ©  2004-2026
浙公网安备 33010602011771号 浙ICP备2021040463号-3