摘要:
动态规划 参考网站:https://people.cs.clemson.edu/~bcdean/dp_practice/ 引入:Fibonacci Sequence 对于Fibonacci Sequence:斐波那契数,通常用 F(n) 表示,形成的序列称为斐波那契数列。该数列由 0 和 1 开始, 阅读全文
摘要:
gensim中常用的Word2Vec,Phrases,Phraser,KeyedVectors gensim API 1. Phrases 和Phraser gensim.models.phrases.Phrases 和gensim.models.phrases.Phraser的用处是从句子中自动检 阅读全文
摘要:
WMD Paper: From Word Embeddings To Document Distances 2015年,提出词移距离WMD(Word Mover's Distance):词移距离是在词向量的基础上发展而来的用来衡量文档相似性的度量, 是一种计算句子之间距离的方法,距离越小,相似度越高 阅读全文
摘要:
各种优化器SGD,AdaGrad,Adam,LBFGS都做了什么? 优化的目标是希望找到一组模型参数,使模型在所有训练数据上的平均损失最小。对于参数的迭代更新$\theta \leftarrow \theta -\eta g$,主要是从两个方面,一个是梯度修正$g$,一个是学习率$\eta$调整。基 阅读全文
摘要:
HNSW 解决的问题:做高效率相似性查找。推荐系统中,如何找到与用户query最相近的几个item,然后推荐出去。 解决方法有:Annoy,KD-Tree, LSH, PQ,NSW, HNSW等。 近似最近邻搜索算法(Approximate Nearest Neighbor Search,ANNS) 阅读全文