机器学习概论
1.机器学习分类
早期机器学习分为监督式学习、非监督式学习和强化学习。
1.1监督式学习:
在学习过程中,我们不断向计算机提供数据以及数据所对应算法下的value或者说标签,比如说给教会计算机识别猫和狗,然后我们再给计算机看图片,让计算机识别出该图片是猫还是狗,这种学习方式就叫做监督式学习。
1.2非监督式学习:
在学习过程中,只提供输入数据,但没有为算法提供输出数据,让计算机通过算法来分类,叫作非监督式学习;比如只提供计算机猫和狗的图片,但不告诉计算机这些图片是猫还是狗,让计算机学习并且分类总结出两组图片的不同。
1.3强化学习:
把计算机放在一个陌生的环境,让它完成从未接触过的任务,计算机会尝试各种方法,最后适应这个环境并且掌握学习这些任务的方法。就好比学生学习一样,对于陌生的题型错误率很高,完成效率也低,但经过不断总结规律,达到又好又快的状态。(典型案例:阿尔法狗)
2. 机器学习步骤
2.1数据预处理,分为测试数据和训练资料,其中测试数据和训练数据必须打乱确保测试集中包含所有类别数据
2.2算法学习
2.3回溯测试,用测试资料测试
2.4新数据进来,得到最后标签或者value。