手动在本地搭建GPT大模型过程

20211325手动在本地搭建GPT大模型过程

一、搭建原因

  暑假期间由于闲着无聊且有娄老师在群里经常发一些GPT相关的文章和资料,因此对GPT有了兴趣,再加上我也经常在github上浏览和下载使用一些有趣的公开项目,由此开始着手了解GPT的构建和训练。

二、搭建过程(由于当时没有想到要写博客因此截图较少)

(1)前期准备

  上浏览器自主搜索相关视频,参考视频来源以B站为主,尝试了包括抱脸,CloseAI,直接使用API-KEY链接官网使用,结果效果都不佳,最后在去github找的时候发现了一个简单好懂的下载器:GPT4ALL

(2)配置过程

  去github上找官方链接和说明,链接为:https://gpt4all.io/index.html

 

 github下载链接:https://github.com/nomic-ai/gpt4all

 其中可以选择在第一链接下选择相应的操作系统对应的安装包,我由于是win11系统,因此选择了windows的下载路径直接下载。

下载完成后会自动在桌面创建快捷方式以便启动。点击启动会出现很多模型供选择,如下图:

 

 其中ChatGPT-4与ChatGPT-3.5 Turbo是需要去自己账号上创建API-KEY去链接官网下载模型,由于之前尝试过使用API-KEY结果网页版显示没反应,因此没有尝试这两种,也因此导致本地的模型训练量和准确度上会少有偏差。具体表现为不稳定,以及回答似乎固定英文。

 以及苏格拉底:

 其中反应速度还是比较快的,能够达到使用预期,但是由于无法识别复杂意思的中文,因此需要借助翻译软件配合使用。

解决方法:

由于无法输入复杂逻辑中文进行交互,因此我试了第二种模型,中文能够正常解决,但是反应速度较慢:

 (另:两个模型由于在本地布置,因此都不需要依靠网络就能进行问答)

posted on 2023-10-14 17:54  STERNSTUN  阅读(883)  评论(0编辑  收藏  举报

导航