山东大学项目实训-基于LLM的中文法律文书生成系统(五)- ChatGLM3

ChatGLM3 对话格式

为了避免用户输入的注入攻击,以及统一 Code Interpreter,Tool & Agent 等任务的输入,ChatGLM3 采用了全新的对话格式。


ChatGLM3 对话的格式由若干对话组成,其中每个对话包含对话头和内容,一个典型的多轮对话结构如下

 You are ChatGLM3, a large language model trained by Zhipu.AI. Follow the user's instructions carefully. Respond using markdown.
 Hello, I'm ChatGLM3. What can I assist you today?




其中 <|role|> 部分使用 special token 表示,无法从文本形式被 tokenizer 编码以防止注入。metadata 部分采用纯文本表示,为可选内容。

  • <|system|>:系统信息,设计上可穿插于对话中,但目前规定仅可以出现在开头

  • <|user|>:用户

    • 不会连续出现多个来自 <|user|> 的信息

  • <|assistant|>:AI 助手

    • 在出现之前必须有一个来自 <|user|> 的信息

  • <|observation|>:外部的返回结果

    • 必须在 <|assistant|> 的信息之后


为提升可读性,下列样例场景中表示角色的 special token 前均额外添加了一个换行符。实际使用及 tokenizer 实现中均无需额外添加这一换行。


  • 有且仅有 <|user|><|assistant|><|system|> 三种 role

 You are ChatGLM3, a large language model trained by Zhipu.AI. Follow the user's instructions carefully. Respond using markdown.
 Hello, I'm ChatGLM3. What can I assist you today?



 Answer the following questions as best as you can. You have access to the following tools:
        "name": "get_current_weather",
        "description": "Get the current weather in a given location",
        "parameters": {
            "type": "object",
            "properties": {
                "location": {
                    "type": "string",
                    "description": "The city and state, e.g. San Francisco, CA",
                "unit": {"type": "string"},
            "required": ["location"],
 tool_call(location="beijing", unit="celsius")
 {"temperature": 22}
 根据查询结果,今天北京的气温为 22 摄氏度。



  • <|user|><|assistant|><|system|><|observation|> 四种 role。其中 <|assistant|> 的 metadata 只有 interpreter。

 #File: /mnt/data/metadata.jsonl
 #Size: 35380
 #File uploaded
 import json
 # Load the uploaded file
 data = []
 with open("/mnt/data/metadata.jsonl", 'r') as file:
    for line in file:
 # Display the first few records to get a sense of the data
 [{'file_name': 'aceinthehole.png',
  'name': 'Ace in the Hole',
  'type': 'survivor',
  'description': 'Lady Luck always seems to be throwing something good your way.'},
  {'file_name': 'adrenaline.png',
  'name': 'Adrenaline',
  'type': 'survivor',
  'description': 'You are fuelled by unexpected energy when on the verge of escape.'},
  {'file_name': 'aftercare.png',
  'name': 'Aftercare',
  'type': 'survivor',
  'description': "Unlocks potential in one's aura reading ability."},
  {'file_name': 'agitation.png',
  'name': 'Agitation',
  'type': 'killer',
  'description': 'You get excited in anticipation of hooking your prey.'},
  {'file_name': 'alert.png',
  'name': 'Alert',
  'type': 'survivor',
  'description': 'Your acute senses are on high alert.'}]
 file_name: 文件名称
 name: 名称
 type: 类型(例如 "survivor" 或 "killer")
 description: 描述
 # Check for missing values in each column
 missing_values = {key: sum(1 for item in data if key not in item) for key in data[0].keys()}
 {'file_name': 0, 'name': 0, 'type': 0, 'description': 0}
 # Check the distribution of values in the 'type' column
 type_distribution = {key: sum(1 for item in data if item['type'] == key) for key in set(item['type'] for item in data)}
 {'survivor': 116, 'killer': 103}
 import numpy as np
 import matplotlib.pyplot as plt
 # 爱心形状的参数方程
 def heart(t):
    x = 16 * np.sin(t) ** 3
    y = 13 * np.cos(t) - 5 * np.cos(2 * t) - 2 * np.cos(3 * t) - np.cos(4 * t)
    return x, y
 t = np.linspace(0, 2 * np.pi, 1000)
 x, y = heart(t)
 plt.figure(figsize=(6, 6))
 plt.plot(x, y, color='red')



  • max_length: 模型的总token限制,包括输入和输出的tokens

  • temperature: 模型的温度。温度只是调整单词的概率分布。其最终的宏观效果是,在较低的温度下,我们的模型更具确定性,而在较高的温度下,则不那么确定。

  • top_p: 模型采样策略参数。在每一步只从累积概率超过某个阈值 p 的最小单词集合中进行随机采样,而不考虑其他低概率的词。只关注概率分布的核心部分,忽略了尾部部分。


Use Casetemperaturetop_p任务描述
代码生成 0.2 0.1 生成符合既定模式和惯例的代码。 输出更确定、更集中。有助于生成语法正确的代码
创意写作 0.7 0.8 生成具有创造性和多样性的文本,用于讲故事。输出更具探索性,受模式限制较少。
聊天机器人回复 0.5 0.5 生成兼顾一致性和多样性的对话回复。输出更自然、更吸引人。
调用工具并根据工具的内容回复 0.0 0.7 根据提供的内容,简洁回复用户的问题。
代码注释生成 0.1 0.2 生成的代码注释更简洁、更相关。输出更具有确定性,更符合惯例。
数据分析脚本 0.2 0.1 生成的数据分析脚本更有可能正确、高效。输出更确定,重点更突出。
探索性代码编写 0.6 0.7 生成的代码可探索其他解决方案和创造性方法。输出较少受到既定模式的限制。
posted @   H1S96  阅读(45)  评论(0编辑  收藏  举报
· 25岁的心里话
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 零经验选手,Compose 一天开发一款小游戏!
· 因为Apifox不支持离线,我果断选择了Apipost!
· 通过 API 将Deepseek响应流式内容输出到前端