Fork me on GitHub

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

11月LLM待学习

iterative dpo :

Sentence-BERT/BERT相关模型

Word2Vec/Doc2Vec计算语义相似度

TF-IDF + 余弦相似度

BM25算法

使用Sentence-BERT

from sentence_transformers import SentenceTransformer
from sklearn.metrics.pairwise import cosine_similarity
import numpy as np

加载模型

model = SentenceTransformer('paraphrase-multilingual-MiniLM-L12-v2')

工具名称及描述

tools = {
"PPT大纲": "用于生成PPT演示文稿的框架结构",
"申请书": "用于生成各类申请书、报告的模板",
"论文查重": "检测文章重复率"
}

def get_tool_similarity(query, tools):
# 编码query
query_embedding = model.encode(query)

similarities = {}
for tool_name, desc in tools.items():
    # 编码工具描述
    tool_embedding = model.encode(desc)
    # 计算余弦相似度
    similarity = cosine_similarity(
        query_embedding.reshape(1, -1), 
        tool_embedding.reshape(1, -1)
    )[0][0]
    similarities[tool_name] = similarity

return similarities

使用示例

query = "国家励志奖学金申请书"
similarities = get_tool_similarity(query, tools)
best_match = max(similarities.items(), key=lambda x: x[1])
print(f"最匹配的工具是: {best_match[0]}, 相似度: {best_match[1]:.4f}")
'''

posted @   365/24/60  阅读(6)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· winform 绘制太阳,地球,月球 运作规律
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
点击右上角即可分享
微信分享提示