摘要: what 余弦相似度是一种用于度量向量相似性的metric。 \[cos\theta = \frac{A.B}{|A|.|B|} \] A.B:向量的内积 |A|:向量的模长 \(cos\theta\):的范围$ [ -1 , 1 ] $ why 余弦相似度的计算复杂度很低,对于稀疏向量而言,只用考 阅读全文
posted @ 2024-12-15 22:38 cxy8 阅读(3) 评论(0) 推荐(0) 编辑
摘要: what permutations是python的itertools模块的一个函数,可以用来求可迭代对象的全排列 itertools.permutations(iterable, r) iterable:可迭代对象 r:全排列的长度 return:tuple 后面r的作用解释一下,加入iterabl 阅读全文
posted @ 2024-12-15 00:59 cxy8 阅读(6) 评论(0) 推荐(0) 编辑
摘要: what map是python提供的一个内置函数,用于对一个序列中每个元素,或者对多个序列中对应元素进行操作。 why 函数式编程范式的一种工具,可以代替一些循环操作。同时map操作在小数据100W即1e7的时候操作会比for循环和列表表达式快。 但是当继续增大数据量就会显出劣势,不过在处理小数据时 阅读全文
posted @ 2024-12-15 00:42 cxy8 阅读(32) 评论(0) 推荐(0) 编辑