09 2024 档案

摘要:简介 论文链接:https://jiemingzhu.github.io/pub/pjhe_icws2017.pdf 代码实现:https://github.com/logpai/logparser/tree/main/logparser/Drain 算法原理图: 有几点注意: 根节点和叶节点实际是 阅读全文
posted @ 2024-09-30 15:51 漫漫长夜何时休 阅读(209) 评论(0) 推荐(0) 编辑
摘要:简介 paper : https://arxiv.org/abs/2307.09288 code :https://github.com/facebookrese 解释 : https://zhuanlan.zhihu.com/p/649756898 处理流程 预处理文本 输入:文本(问题) 处理: 阅读全文
posted @ 2024-09-30 15:27 漫漫长夜何时休 阅读(70) 评论(0) 推荐(0) 编辑
摘要:问题背景 ⼤模型通常包含数亿甚⾄数百亿个参数,对其进⾏微调需要⼤量的计算资源和存储空间。 在微调过程中,直接修改预训练模型的所有参数可能会破坏模型的原始性能。 存储和部署微调后的⼤模型需要⼤量存储空间,尤其是当需要在多个应⽤场景中部署不同微调版本时。 许多微调⽅法会增加推理阶段的计算延迟,影响模型的 阅读全文
posted @ 2024-09-25 13:33 漫漫长夜何时休 阅读(248) 评论(0) 推荐(0) 编辑
摘要:格式 [ { "conversations": [ { "from": "human", "value": "user instruction" }, { "from": "gpt", "value": "model response" }, ... ], "system": "system pro 阅读全文
posted @ 2024-09-25 10:58 漫漫长夜何时休 阅读(698) 评论(0) 推荐(0) 编辑
摘要:格式 alpaca 格式的数据集应遵循以下格式: [ { "instruction": "user instruction (required)", "input": "user input (optional)", "output": "model response (required)", "s 阅读全文
posted @ 2024-09-25 10:18 漫漫长夜何时休 阅读(1063) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示