摘要: February 24, 2024 提示工程学习笔记(二) 在 上一篇笔记 中,我们学习了很多提示工程相关的技术,比如思维链(CoT)和最小到最多提示(Least-to-Most Prompting)等,显著改善了大模型的推理能力。尽管如此,我们常常还是会看到这样的现象:大模型可以准确地生成解决问题 阅读全文
posted @ 2024-05-15 16:50 bonelee 阅读(1152) 评论(0) 推荐(0) 编辑
摘要: 训练业务代码适配昇腾PyTorch代码适配 前提条件 要迁移的训练任务代码在GPU上多次训练稳定可收敛。训练业务代码和数据,应该确保在GPU环境中能够运行,并且训练任务有稳定的收敛效果。 本文只针对基于PyTorch的训练脚本迁移。这里假设用户使用的是基于PyTorch的训练代码进行迁移。其他的AI 阅读全文
posted @ 2024-05-15 16:09 bonelee 阅读(719) 评论(0) 推荐(0) 编辑