摘要:8月28日,2024中国国际大数据产业博览会在贵阳开幕。会议期间,国家数据局局长刘烈宏主持召开企业家座谈会,上海合合信息科技股份有限公司董事长镇立新受邀参加。
刘烈宏认真听取企业家的发言,并表示,企业家们提供的情况为我们分析当前数字领域发展形势、研究制定政策举措提供了非常重要的参考。
阅读全文
摘要:不论是在社交媒体平台还是各类工作学习资料,大大小小的图像和文件水印是我们习以为常的附赠产物,在图像上叠加可见水印为解决版权问题提供了一种强有力的手段,它被用于在互联网共享时标识和保护图像版权。 随着AIGC内容快速且大批量的产生,可见水印同样在其从传播过程中发挥着重要的作用。 而基于技术发展相辅相成
阅读全文
摘要:针对大模型“理解力”薄弱,数据读取错误等问题,合合信息大模型“加速器”方案优化升级了PDF文档解析技术,将非结构化的PDF内容转换为结构化数据,提高大模型图表类数据提取准确性和版面理解能力,助力大模型实现从”泛读“到“精读“的能力跨越。
阅读全文
摘要:近期,TextIn团队开发的PDF转Markdown插件已经上架Coze平台。今天我们抛砖引玉,介(an)绍(li)几种PDF转Markdown插件的有趣玩法!
阅读全文
摘要:为进一步加大沪港两地协同效应,实现城市科技创新发展愿景,沪港两地正围绕数据流通和应用展开多维度的合作。近期,备受瞩目的“数据要素x沪港合作开放数据竞赛2024”颁奖典礼暨“数据要素x”大赛上海分赛出征仪式圆满举行。上海市数据局副局长、上海市大数据中心主任邵军,香港特别行政区政府数字政策办公室数字政策
阅读全文
摘要:近日,TextIn开发的PDF转Markdown插件正式上架Coze平台。 在扣子搜索“pdf转markdown”,或在Coze平台搜索“pdf2markdown”,即可找到插件,在你的专属智能体中便捷使用文档解析功能。 如果想测试解析插件在你需要的场景下表现如何,可以直接对话bot,试用pdf转m
阅读全文
摘要:近日,“中国大学生服务外包创新创业大赛”(以下简称“服创大赛”)决赛在江南大学圆满落幕。作为服务外包产业领域唯一的国家级赛事,近年来服创大赛的竞赛内容与方式不断创新,品牌效应持续扩大,已累计吸引1600余所院校、50余万名大学生报名参加。在人工智能发展如火如荼之际,大赛鼓励越来越多的青年学子们用创新技术解决现实社会问题。合合信息作为人工智能科技企业的代表,为参赛队伍提供赛题指导与技术支持,与高校学子共同探索技术应用场景广阔蓝海。
阅读全文
摘要:TextIn团队的文档解析测评工具Markdown Tester在Github发布后,我们陆续与大家探讨了目前业内对PDF解析工作的评判标准与我们各项测评指标的设计原理,包括段落、表格、公式、阅读顺序等维度。
今天,我们将介绍另一项重要指标,也是业内面对的一项普遍性难点:标题识别,以及它如何影响数据清洗与RAG系统开发。
阅读全文
摘要:随着我国外贸新业态的快速增长,银行国际结算业务在服务实体经济发展、促进贸易投资便利化进程中发挥了越来越重要的作用。根据中国银行业协会近日发布的《中国贸易金融行业发展报告(2023—2024)》,2023年我国主要商业银行国际结算规模再创历史新高,达到11.57万亿美元,较上一年增幅4.4%。中国商业
阅读全文
摘要:随着大模型文档智能应用逐渐步入正轨,文档解析类产品成为其中重要的一环。文档解析工具能够“唤醒”沉睡在PDF文件中的知识,将其转化为机器能够识别、读取的信息,将可用数据从txt、csv格式扩展到大批量的电子档、扫描档文件,为数据处理、大模型训练、RAG系统开发提供优质的“燃料”。
近期,文档解析的赛道越发火热,大量企业、开发者入局,为AI应用者提供更多可选产品。最近我们也在文章《以后再也不用肉眼测评解析产品了》(+link)中探讨了面对多种选项,我们应如何挑选适合自己业务场景的产品。
然而,作为解析产品的开发者之一,我们认为:PDF解析,还能做得更好,为用户提供更可靠、优质的服务。
阅读全文