更新 3/75 — 重回正轨,重回 Vallendar

更新 3/75 — 重回正轨,重回 Vallendar

最后让我给你一些关于我实际工作的更多细节。 第一篇论文可能会被称为“FinRAG”,指出检索增强生成(RAG,Lewis 等人,2020 年)和金融领域应用的结合。

FinRAG 将是一种将一组 PDF 和一个问题作为输入的方法,并将提供一个 根据PDF回答问题 .它还将提供页码、文件名和信息来源的上下文。这是 适合金融和法律专业人士 因为他们经常需要手动仔细检查任何机器提供的信息以避免错误。

您可以关注以下更新: 子栈 博客 电报 WhatsApp 领英 中等的 推特 日历

WHU InPraxi Alumni Homecoming August 2022, picture by me

自上周以来发生了什么?

首先,我没有遵循 乔卡拉亚诺夫 的建议尝试一种新的休息方式。 (她的做法:每隔 15 分钟休息一下,在房间里走一分钟。大约 3 次后,可以休息更长的时间或走到外面。)我投入工作,当我意识到我没有跟break 方法,已经太晚了,我宁愿把工作做好。此外,工作需要等待很长时间才能完成代码,所以我一直没有充分利用。我将在接下来的几周内做到这一点!

我会见了组织者( 托尔加·雷南·巴斯图克 本尼迪克特·布赫纳 ) 来自德国商业银行的机器学习社区。我们已经确定了一个日期,我将介绍文档检索和检索增强生成领域的最新发展。

星期六,我在我的理学士学校举办了一次校友活动。母校, WHU——奥托贝斯海姆管理学院 .在那里我认识了许多新老朋友,周六出色的聚会让我感到疲倦。

最大的障碍是什么?

为新文本生成嵌入所需的计算能力可能高于预期。 这可能会使用户输入的 PDF 的近时间处理变得不可能 .因此,我最初打算上传 PDF 和一组问题然后立即得到答案的用例可能在这一点上是不现实的。

这可能会成为一个大问题。

但我想并希望我可能只是在算法的配置上犯了一个错误,仔细检查后算法会更快。

我实现了哪些目标?

上周的目标 1:我的主管安排了与我的约会,讨论我的研究计划。这将在两周内完成。

上周的目标 2:大喊 托马斯·休伯 ,来自圣加仑大学的同事,感谢您向我发送了一段代码片段,我感激地复制了它。 MVP 现在正在工作(从 PDF 到基于 PDF 的答案)!

上周的目标 3:在我的文献数据库中添加了计划中的文献检索和相关方法的文献集。

我错过了哪些目标?

是的,这周一切都很好!

这是一个美好的一周吗?

是的,所有目标都实现了! MVP目标是一个很大的目标。安排与我的主管会面也很重要。

周六我有一个很棒的 WHU 校友返校节,还有我的一个好朋友和 WHU 朋友 扬·特南鲍姆 星期五已经从柏林来访问了。感谢您度过了愉快的时光。

下周的短期任务

  1. 从 PDF 生成答案时,软件应该能够跟踪页面和标题(为结果提供上下文)。这对用户来说很重要,因为他们经常需要手动验证生成的答案是否正确。
  2. CLI 入口点:为了使模块更加通用,我想提供一个方便的命令行入口点。开发人员可以指向带有输入 PDF 的文件夹并插入问题/查询,并且可以直接从 shell 执行程序。
  3. 准备与我的主管的研究提案会议。

关于“75 步博士之路”在自然语言处理”

从现在开始,你将见证我的磨砺。感受我的鲜血、汗水和泪水。

通过这一系列文章,您将成为我论文进展的真实每周见证人,所有这些都在 75 个步骤中完成。这有多种用途:

1)强迫自己在公众耻辱的力量中继续前进!

2)帮助其他(未来的)博士。学生保持积极性,并表明在这个过程中遇到困难是正常的。

  1. 在我遇到困难时获得社区的支持。

与您的博士分享。学生朋友: 子栈 博客 电报 WhatsApp 领英 中等的 推特 日历 .

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明

本文链接:https://www.qanswer.top/15372/27590508

posted @   哈哈哈来了啊啊啊  阅读(20)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
点击右上角即可分享
微信分享提示