随笔分类 -  算法

摘要:一个真实的翻车现场 最近在做一个政务信息抽取的项目,需要从网页里提取"中国人民银行的职责",听起来很简单对吧?把文档切成句子,灌进向量数据库,用关键词检索,取topK个最相似的片段。 结果翻车了。 我写了个小工具,把每个切分后的句段和查询关键词的匹配度可视化出来。提取"中国人民银行的编制"时效果不错 阅读全文
posted @ 2026-05-27 15:39 Earic 阅读(8) 评论(0) 推荐(0)
只有注册用户登录后才能阅读该文。
posted @ 2018-06-06 17:56 Earic 阅读(4) 评论(0) 推荐(0)