11月LLM待学习
iterative dpo :
- https://github.com/RLHFlow/Online-RLHF
- https://github.com/YuxiXie/MCTS-DPO (蒙特卡洛树dpo)
longWriter:https://github.com/THUDM/LongWriter/tree/main
agent:了解跑通agent的四种功能
rag:
文本匹配:TinyBERT、LightMatcher
'''
Sentence-BERT/BERT相关模型
Word2Vec/Doc2Vec计算语义相似度
TF-IDF + 余弦相似度
BM25算法
使用Sentence-BERT
from sentence_transformers import SentenceTransformer
from sklearn.metrics.pairwise import cosine_similarity
import numpy as np
加载模型
model = SentenceTransformer('paraphrase-multilingual-MiniLM-L12-v2')
工具名称及描述
tools = {
"PPT大纲": "用于生成PPT演示文稿的框架结构",
"申请书": "用于生成各类申请书、报告的模板",
"论文查重": "检测文章重复率"
}
def get_tool_similarity(query, tools):
# 编码query
query_embedding = model.encode(query)
similarities = {}
for tool_name, desc in tools.items():
# 编码工具描述
tool_embedding = model.encode(desc)
# 计算余弦相似度
similarity = cosine_similarity(
query_embedding.reshape(1, -1),
tool_embedding.reshape(1, -1)
)[0][0]
similarities[tool_name] = similarity
return similarities
使用示例
query = "国家励志奖学金申请书"
similarities = get_tool_similarity(query, tools)
best_match = max(similarities.items(), key=lambda x: x[1])
print(f"最匹配的工具是: {best_match[0]}, 相似度: {best_match[1]:.4f}")
'''
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· winform 绘制太阳,地球,月球 运作规律
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人