1. CRF : 条件随机场,一种用来标记和切分序列化数据的统计模型,主要用作语音识别和文本识别,前提是有一个已经标记了的观察序列。
2. 造成过拟合的原因有两个:第一是:训练数据不足,第二个是:训练过度导致模型非常的复杂,泛化能力差。
3. 降低过拟合的方法:正则化方法,减少参数量,增大训练数据集
4. 判别式模型:是直接对条件概率的建模。常见的模型:线性回归,支持向量机,神经网络模型等
生成式模型:对联合分布概率的建模,常见的模型有:马尔可夫模型,朴素贝叶斯模型,高斯混合模型