摘要: dbscan是一个简单的聚类算法,之前做了word2vec后需要找相似的词,于是自己用python实现了一个; 这个算法很简单也很快,sklearn也有实现方法,但是我需要自定义距离的计算方式,sklearn貌似不提供,所以自己写了一个类,见下面代码;有需要随意拿去用; 阅读全文
posted @ 2017-03-17 14:21 LarryGates 阅读(835) 评论(0) 推荐(0) 编辑
摘要: VAE是一个神奇得算法,其实思想倒是有点像word2vec,只是在其上加了一层bayesian的思想,这点上又倒是有点像LDA了; 个人觉得,VAE挖掘的好的话,倒是有很大的潜力和应用的,因为它是真正意义上的无监督的,句子表示成向量之后,然后你就可以想干嘛就干嘛了; 简单介绍一下VAE,就是一个变分 阅读全文
posted @ 2017-03-17 14:15 LarryGates 阅读(3835) 评论(2) 推荐(0) 编辑