摘要:合合信息旗下的启信宝,作为行业领先的商业查询APP,依托其3亿企业及机构的实时动态数据,涵盖工商、股权、司法、知识产权等多维度信息,推出了“司法大数据”功能。
阅读全文
摘要:生成式人工智能作为新一轮的技术革命成果,在赋能千行百业,给经济社会发展带来新机遇的同时,也产生了个人信息泄露、数据安全风险等问题。在此背景下,中国信息通信研究院(简称“中国信通院”)联合抖音、百度、阿里巴巴、科大讯飞、合合信息等科技企业,共同参与了《生成式人工智能个人信息保护技术要求》系列标准(下称
阅读全文
摘要:前几天,有一位用户使用OCR产品识别多栏论文后向我们询问:要怎么解决不合适的断句、分段以及错误阅读顺序的问题? 我们用一个相似案例为大家直观展示这位用户遇到的情况。 如图中的多栏期刊,如果用OCR识别,或直接在一些办公软件对文字进行复制黏贴,我们就会得到右侧的效果——按PDF排版而不是语义进行换行分
阅读全文
摘要:一、简要介绍 本文简要介绍了大模型热门论文“Let’s Verify Step by Step ”的相关工作。近年来,大型语言模型在执行复杂的多步骤推理的能力上有了显著的提高。然而,即使是最先进的模型也会经常产生逻辑错误。为了训练更可靠的模型, 可以转向为最终结果提供反馈的结果监督,或者转向为每个中
阅读全文
摘要:一、简要介绍 论文研究了自深度学习出现以来,预训练语言模型的算法的改进速度。使用Wikitext和Penn Treebank上超过200个语言模型评估的数据集(2012-2023年),论文发现达到设定性能阈值所需的计算大约每8个月减半一次,95%置信区间约为5到14个月,大大快于摩尔定律下的硬件增益
阅读全文
摘要:上周,文档解析测评工具发布后,我们收到最多的反馈问题是—— 你们这套测试指标是如何确定的?表格、段落、标题、阅读顺序、公式这些维度分别代表什么? 测试结果中数字都有什么意义?在实际使用中又起到怎样的作用呢? 大家关心的问题,就是我们的最高优先级。 近期,我们会根据用户朋友们的反馈意见不断优化测评工具
阅读全文
摘要:随着科学技术的发展,促进人工智能产业与高校人才培养相融合,正成为业界关注的焦点。7月3日,上海合合信息科技股份有限公司(以下简称:合合信息)与同济大学软件学院“产教融合人才培养签约暨创新实践基地”揭牌仪式顺利举行。合合信息董事长镇立新、副总经理陈青山及主要业务相关负责人,同济大学软件学院党委书记宋庆
阅读全文
摘要:今天给大家介绍一款测评工具,能方便快捷且全面地展示文档解析产品的能力。 没错,这个测评工具是我们做的✌️。 它的最大作用,是协助需要解析PDF的用户直观筛选最适合自己场景的产品。 在和用户交流的过程中,我们发现大家的需求非常多样,各有偏重:年报、财报、论文、政策文件、企业内部文件,或是教科书、试卷、
阅读全文
摘要:TextIn Tools是一款免费的在线OCR工具,支持快速准确的文字和表格识别,手写、古籍识别,提供PDF转Markdown大模型辅助工具,同时支持PDF、WORD、EXCEL、JPG、PPT等各类格式文件的转化。 TextIn Tools特点 免费:所有产品提供每日200页免费额度,覆盖日常使用
阅读全文
摘要:论文提出的证据表明,通过有效地探索收集人类反馈以改进大型语言模型有实质性的好处。在论文的实验中,一个代理依次生成查询,同时拟合一个奖励模型的反馈收到。论文的最佳性能代理使用双汤普森抽样生成查询,其不确定性由一个认知神经网络表示。论文的结果表明,有效的探索可以用更少的查询实现高水平的性能。此外,不确定性估计和探索方案的选择都起着关键作用。
阅读全文