摘要: 一、首先学习学习knn算法。kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个... 阅读全文
posted @ 2018-05-16 22:16 HeCCXX 阅读(257) 评论(0) 推荐(0) 编辑
摘要: jieba是python第三方库,用于自然语言处理,对文本进行分词,当然也有其他的分词库。gensim库,利用TFIDF算法来进行文本相似度计算,通过利用gensim库的corpora,models,simila... 阅读全文
posted @ 2018-05-16 20:57 HeCCXX 阅读(1618) 评论(0) 推荐(1) 编辑