复习NLP-实战(八)----HMM工具包实战

1.hmmlearn工具包

实现中文分词,完全没懂。

第九章:走进深度学习-神经网络算法

前言:机器学习下面的一个分支,运用神经网络算法的,属于深度学习。

深度学习算法一般是和计算机视觉挂钩的。

1.k近邻算法(KNN)。

K近邻算法很好理解。就是当前待分类点的K个邻居,属于哪种分类的概率大,我们也就将这个点分到该类别下。利用此图,可以更好地理解。

 

 

优缺点:

 

 相当于待分类的这个点,要和所有的样本都计算一次距离,所以时间复杂度为O(n)

可以用来测试的一个数据集(CIFAR-10):

计算距离的话,可以选用L1距离,也可以显示L2距离(欧式距离),欧式距离用的比较多。

交叉验证:

主要是为了解决测试集只能使用一次,而待求解的参数比较多的缺陷。对训练集进行切割,重新多次选定不同的数据源,作为训练集。来求解参数的一种方法。

 

posted on 2019-09-18 15:34  毛无语666  阅读(469)  评论(0编辑  收藏  举报

导航