上一页 1 2 3 4 5 6 7 8 9 ··· 271 下一页
摘要: 大模型评估指标 1.基础评估指标 参考klu.ai和Microsoft.com的评估指标列表如下:https://klu.ai/glossary/llm-evaluation 类别 度量 描述 用户参与度和效用指标 访问 访问LLM应用程序功能的用户数 提交 提交提示词的用户数 响应 LLM应用程序 阅读全文
posted @ 2024-04-23 10:57 bonelee 阅读(5936) 评论(2) 推荐(1) 编辑
摘要: 大语言模型(LLM)评价指标小汇总(也许会更新) from:https://zhuanlan.zhihu.com/p/641416694 ​ 目录 总之就是接了个小项目,这些天统计了一些LLM评价指标,不算很全面,很多方法的具体操作都不是很熟悉,参考论文也没找全,大家就凑合着看: 1. 榜单、论文统 阅读全文
posted @ 2024-04-23 09:46 bonelee 阅读(1226) 评论(0) 推荐(0) 编辑
摘要: 什么是Auto-GPT 地址:github.com/Torantulino… 这个程序由GPT-4驱动,将LLM"思想"链接在一起,以自主实现您设定的任何目标。 Auto-GPT是将OpenAI的GPT模型的多个实例链接在一起,使其能够在没有帮助的情况下完成任务、编写和调试代码以及纠正自己的编写错误 阅读全文
posted @ 2024-04-19 15:46 bonelee 阅读(246) 评论(0) 推荐(0) 编辑
摘要: KG2Prompts是什么? KG2Prompts 是一个用于将知识图谱转换为自然语言提示的工具。它使用预训练的语言模型来生成提示,这些提示可以用于各种任务,例如文本生成、问答和摘要。 KG2Prompts 的工作原理如下: 首先,它将知识图谱转换为一个图结构,其中节点代表实体,边代表实体之间的关系 阅读全文
posted @ 2024-04-18 11:02 bonelee 阅读(145) 评论(0) 推荐(0) 编辑
摘要: 基于预训练模型的相似度度量方式 BERTScore BERTScore 是一种基于 BERT(双向编码器表示器转换器)语言模型的相似度度量。它将问题和回答编码为 BERT 向量,然后计算两个向量的余弦相似度。与传统的基于重叠词语的相似度度量不同,BERTScore 能够捕获语义相似性,即使两个句子不 阅读全文
posted @ 2024-04-16 20:34 bonelee 阅读(1013) 评论(0) 推荐(0) 编辑
摘要: 关于参数冻结: 在业界使用BERT模型做分类任务时,是否冻结预训练模型的参数取决于具体的应用场景和目标。下面是一些常见的考虑因素: 不冻结参数(全参数微调) 数据量较大:如果有足够多的标注数据,全参数微调可以充分利用这些数据来调整预训练模型的参数,以更好地适应特定任务。 任务特异性较强:对于与预训练 阅读全文
posted @ 2024-04-03 15:37 bonelee 阅读(795) 评论(0) 推荐(0) 编辑
摘要: 摘要 业界首个网络安全大模型评测平台SecBench正式发布(2024-1-19),主要解决开源大模型在网络安全应用中安全能力的评估难题,旨在为大模型在安全领域的落地应用选择基座模型提供参考,加速大模型落地进程。同时,通过建设安全大模型评测基准,为安全大模型研发提供公平、公正、客观、全面的评测能力, 阅读全文
posted @ 2024-03-06 10:44 bonelee 阅读(361) 评论(0) 推荐(0) 编辑
摘要: WMI脚本是什么? WMI(Windows Management Instrumentation)脚本是一种基于Windows管理工具的脚本语言,用于访问和控制Windows操作系统中的管理信息。通过WMI脚本,管理员和开发人员可以获取关于系统状态、正在运行的进程、系统配置等信息,并可以执行各种管理 阅读全文
posted @ 2024-02-21 11:27 bonelee 阅读(85) 评论(0) 推荐(0) 编辑
摘要: https://www.gartner.com/doc/reprints?id=1-2DVHQRLR&ct=230531&st=sb 看最关键的,邮件安全厂商,三大类: A companion tool is also available that includes a larger set of 阅读全文
posted @ 2024-02-19 11:48 bonelee 阅读(300) 评论(0) 推荐(0) 编辑
摘要: https://revbits.com/pdf/RevBits_Email_Security_Product_Brief_Securing_Email_Inboxes.pdf 邮件安全检测场景? 根据文档内容,RevBits邮件安全提供以下邮件安全检测场景: 终端邮件安全代理软件直接部署在用户终端, 阅读全文
posted @ 2024-02-19 11:33 bonelee 阅读(31) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 ··· 271 下一页