Machine learning (1)
-
机器学习的两种定义
- the field of study that gives computers the ability to learn without being explicitly programmed(Arthur Samuel)
- A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.(Tom Mitchell)
- supervised learning : 给定一些不同值的数据,从这些数据中分析出:给一个数据计划预测出“正确的答案”
- regression problem: 预测连续的值(不是严格意义上的连续,可存在精度,可理解为结果集为无穷),预测的结果为给定值的函数值(函数为连续型)
- classification problem: 预测出的结果为离散值(如0或者1或者可数的结果集)
- unsupervised learning : 给定一些数据,分析出的结果是无法预知的(即没有结果集,结果是多变的),如1)分析出这些数据的内部结构,即将所有的数据进行分类;或者2)Associative,建立数据的某些属性之间的联系,例如病人的一些特征与所患疾病(可一种或多种,故结果不确定)之间的联系。
- clustering algorithm: 将一些数据实行分门别类的算法
- associative
- svd: a function(singular value decomposition)