三 、机器学习中的有标签数据和无标签数据
监督学习的数据就是有标签数据,无监督学习的数据就是无标签数据。
有标签的数据应该就是采用有监督学习方式,像线性分类器,神经网络等;
无标签的数据采用非监督学习方式,比如聚类等方法。
半监督式学习问题介于监督式和非监督式学习之间。这里有一个好例子如:照片分类,但是只有部分照片带有标签(如,狗、猫和人),但是大部分照片都没有标签。
许多现实中的机器学习问题都可以归纳为这一类。因为对数据打标签需要专业领域的知识,这是费时费力的。相反无标签的数据和收集和存储起来都是方便和便宜的。