1.问题

在学习大模型的时候,需要一个大模型,我们怎么选择呢?

2.选择模型

2.1 openai

国外的OPENAI这个我们是不能选择的,主要的原因是,我们的网络会经常访问不了,另外收费也麻烦。

2.2 开源大模型

现在 ollama 可以让我们方便在本地部署,我们可以使用不同的大模型,比如 使用 qwen模型,但是这里有个问题,大模型对资源的要求比较高,如果为了完全,我们又有大把银子的话(主要是硬件太贵)。
这里有个问题,比如千问的模型
0.5b参数的大模型,可以在普通的笔记本上,跑的比较顺畅
7b参数的大模型就需要配置比较高的电脑了
70参数的大模型就不是一般笔记本可以跑起来的了,需要很高配置的电脑。
参数越大,大模型越智能,但是也越贵。
比如同一个问题:

{
    "model": "qwen-plus",
    "input": {
        "messages": [
            {
                "role": "user",
                "content": "广州有多少叫张三的人"
            }
        ]
    },
    "parameters": {
        "temperature": 0,
        "result_format": "message",
        "tools": [
            {
                "function": {
                    "name": "loation",
                    "description": "某地区有多少叫什么名字的人",
                    "parameters": {
                        "$schema": "https://json-schema.org/draft/2020-12/schema",
                        "type": "object",
                        "properties": {
                            "address": {
                                "type": "string"
                            },
                            "name": {
                                "type": "string"
                            }
                        }
                    }
                },
                "type": "function"
            }
        ]
    }
}

0.5b的效果如下:

{
  "role": "assistant",
  "content": "广州有大约100万人,其中约50万人叫张三。这可能包括多个个人,因为人口统计学数据可能会包含不同的人群。但是
,在一个城市中,这样的数量是合理的。请注意,这些数字仅供参考,实际人数可能会有所不同。"
}

基本在编。

7b的效果如下:

{
    "function": {
        "name": "loation",
        "description": "某地区有多少叫什么名字的人",
        "parameters": {
            "$schema": "https://json-schema.org/draft/2020-12/schema",
            "type": "object",
            "properties": {
                "address": {
                    "type": "string"
                },
                "name": {
                    "type": "string"
                }
            }
        },
        "request": {
            "address": "广州",
            "name": "张三"
        }
    }
}

能跑70b参数的机器,估计机器都需要几十万。
因此,我们学习 大模型可以使用 7b 的模型。

2.3 使用商用的大模型

其实这个是个比较好的选择,我们可以去阿里云申请 灵积大模型,可以有免费使用,他的免费token 对于我们学习大模型 是够用了,性能也好。

posted on 2024-06-23 11:13  自由港  阅读(16)  评论(0编辑  收藏  举报