最大熵原理:学习概率模型时,在所有可能的概率模型中,熵最大的模型是最好的模型。
熵:表示随机变量不确定性的度量。假设X是一个取有限个值的离散随机变量,其概率分布为
P(X = x_{i}) = p_{i}