09 2024 档案
摘要:简介 论文链接:https://jiemingzhu.github.io/pub/pjhe_icws2017.pdf 代码实现:https://github.com/logpai/logparser/tree/main/logparser/Drain 算法原理图: 有几点注意: 根节点和叶节点实际是
阅读全文
摘要:简介 paper : https://arxiv.org/abs/2307.09288 code :https://github.com/facebookrese 解释 : https://zhuanlan.zhihu.com/p/649756898 处理流程 预处理文本 输入:文本(问题) 处理:
阅读全文
摘要:问题背景 ⼤模型通常包含数亿甚⾄数百亿个参数,对其进⾏微调需要⼤量的计算资源和存储空间。 在微调过程中,直接修改预训练模型的所有参数可能会破坏模型的原始性能。 存储和部署微调后的⼤模型需要⼤量存储空间,尤其是当需要在多个应⽤场景中部署不同微调版本时。 许多微调⽅法会增加推理阶段的计算延迟,影响模型的
阅读全文
摘要:格式 [ { "conversations": [ { "from": "human", "value": "user instruction" }, { "from": "gpt", "value": "model response" }, ... ], "system": "system pro
阅读全文
摘要:格式 alpaca 格式的数据集应遵循以下格式: [ { "instruction": "user instruction (required)", "input": "user input (optional)", "output": "model response (required)", "s
阅读全文