余弦相似度Cosine Sim
what
余弦相似度是一种用于度量向量相似性的metric。
A.B
:向量的内积|A|
:向量的模长 :的范围
why
余弦相似度的计算复杂度很低,对于稀疏向量而言,只用考虑非零向量
How
math库实现
import numpy as np
import math
def cosine_similarity(vec1, vec2) -> float:
norm_vec1, norm_vec2 = 0, 0
dot_product = 0
for v1, v2 in zip(vec1, vec2):
dot_product += v1 * v2
norm_vec1 += v1 * v1
norm_vec2 += v2 * v2
norm_vec1 = math.sqrt(norm_vec1)
norm_vec2 = math.sqrt(norm_vec2)
return dot_product / (norm_vec1 * norm_vec2)
if __name__ == '__main__':
print(cosine_similarity([1, 2, 3], [-1, -2, -3]))
numpy实现
import numpy as np
def cosine_similarity(vec1, vec2) -> float:
norm_vec1 = np.linalg.norm(vec1)
norm_vec2 = np.linalg.norm(vec2)
return np.dot(vec1, vec2) / (norm_vec1 * norm_vec2)
if __name__ == '__main__':
print(cosine_similarity([1, 2, 3], [1, 2, 3]))
pytorch实现
import torch
import torch.nn.functional as F
vec1 = torch.FloatTensor([1, 2, 3, 4])
vec2 = torch.FloatTensor([5, 6, 7, 8])
cos_sim = F.cosine_similarity(vec1, vec2, dim=0)
print(cos_sim)
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报
· DeepSeek在M芯片Mac上本地化部署
2022-12-15 吐槽