摘要: 模型下载: 下载LLAMA3.1,按照:https://blog.csdn.net/lanlinjnc/article/details/136709225 使用的模型:https://huggingface.co/shenzhi-wang/Llama3.1-8B-Chinese-Chat/tree/ 阅读全文
posted @ 2024-10-07 16:32 张扬zy 阅读(25) 评论(0) 推荐(0) 编辑
摘要: 尝试在实验室服务器上本地运行llama,看看llama可以干什么? 然后按照官网运行时报错: ………… File "/defaultShare/archive/zhangyang/llama3/llama/model.py", line 288, in forward mask = torch.tr 阅读全文
posted @ 2024-10-07 16:30 张扬zy 阅读(1) 评论(0) 推荐(0) 编辑
摘要: 在想要实现一个项目https://github.com/xiwan/LLM-Game-Agents时发现部署出了一点问题 先来制定一个蹩脚的计划:◕‿◕ 好吧稍微有点不知道从哪儿开始。 。 因为我不知道正确的应该是什么样的,所以想到目标就觉得有点胆怯了 没找到问题在哪,先尝试一下: `from fl 阅读全文
posted @ 2024-10-07 16:29 张扬zy 阅读(5) 评论(0) 推荐(0) 编辑
摘要: 不同领域实验难以一概而论,就从我的视角来聊聊实验的组成: 首先在motivation上,为什么要这样设计实验? 为了哪些目的,设计了哪些实验? 然后是具体的实施,包括对象的明确,设置(参数、场景等),分组 以及不同类型的文章可以参考:https://zhuanlan.zhihu.com/p/5282 阅读全文
posted @ 2024-09-17 12:05 张扬zy 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 参考文章: Toolformer: Language Models Can Teach Themselves to Use Tools SELF-REFINE: Iterative Refinement with Self-Feedback HuggingGPT: Solving AI Tasks 阅读全文
posted @ 2024-09-17 10:25 张扬zy 阅读(5) 评论(0) 推荐(0) 编辑
摘要: 实验包括:推理任务+决策任务 关注的现象: 准确率 Appendix的内容 实现的疑点: P5的“Combining Internal and External Knowledge”和“Finetune”是什么意思? P15里的“IM-Style”? 我的问题:(纵观之) 1.如何实现评估指标的测量 阅读全文
posted @ 2024-09-15 16:34 张扬zy 阅读(12) 评论(0) 推荐(0) 编辑