会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
China soft
chinasoft.cnblogs.com
首页
新随笔
联系
订阅
管理
2024年4月16日
一周涨 15k Star 的开源项目「GitHub 热点速览」
摘要: https://www.cnblogs.com/xueweihan/p/18137334 你训练大语言模型(LLM)用的什么框架?有没有想过不用框架训练 GPT-2? GitHub 上就有这么一位大神(Andrej Karpathy),他仅用大约 1k 行的 C 代码就完成了 GPT-2 模型的训练
阅读全文
posted @ 2024-04-16 12:10 China Soft
阅读(28)
评论(0)
推荐(0)
编辑
公告