生成式 AI 初探

UPD:修复了 Windows 无法编译的问题

写了一个简单的生成式 AI

功能

  • 根据输入的单词生成一段话(当前训练材料不足,生成词数大约只有 \(50\) 左右)
  • 根据一段材料自训练

原理

  • 统计累计词频,为词频计入权重
  • 统计使用次数(防止循环用词等情况)

注意

  • 由于当前缺乏什么有效的训练材料,去 CF 粘了几篇 Announcement,导致这货说话特别像 Announcement,而且并不是太通顺
  • 并不支持根据未见过的词生成句子,因此太偏僻的不行,不过你可以通过喂 AI 一篇带这个词的文章来让它学

使用

  • 主函数上方的 #define TRAIN,注释掉即可使用 test(),即根据词生成句子,不注释掉则可以根据本地 train 文件里的内容自训练
  • 请务必保证有一个 info 文件,如果你想重头训练,可以删掉 info 中得全部内容,但请务必保留一个 \(0\)

声明

  • 这只是一个尝试,代码实现与生成效果比较烂,仅供娱乐与参考使用

源码(含初步训练信息)

Download

posted @ 2024-10-18 21:32  HaneDaniko  阅读(208)  评论(64编辑  收藏  举报