摘要:
在回归分析(regression)中,我们的目的是为输入数据找到合适的函数表达,常用于预测新数据的值。线性回归(linear regression),其中的函数形式对输入数据而言是线性的,是到目前为止最流行也是研究最透彻的一种回归形式。在函数内插(interpolation)中,我们已知的是一定范围内的输入数据所对应的函数值,而要解决的是如何求出位于执行输入点之间的数据点的函数值。密度函数估计(density estimation)用于求解具有某种特定特征的类别成员(样本)出现的(概率)密度问题。 阅读全文
摘要:
假设有A、B两个类别,feature为特征值,count为数量。蓝色和红色的曲线分别表示了,随着特征值的变化,A类别事物出现的数量以及B类别事物出现的数量。假如,将A类别错分为B类别的代价与将B类别错分为A类别的代价是相同的,那么可以取X0作为区分的阈值,即,对于某个类别未确定的样本,如果其特征值大于X0,那么将其判为B类,否则判为A类。如果不想将A类错判为B类,即将A类错判为B类的错误代价更大,那么可以在[X1,X0]之间取值作为判别的阈值。相反的,如果不想讲B类错判为A类,即将B类错判为A类的错误代价更大,那么可以在[X0,X2]之间取值作为判别的阈值。 阅读全文
该文被密码保护。 阅读全文