1.机器学习概述
1.python基础的准备
本课程拟采用Python做为机器算法应用的实现语言,所以请确保:
1)安装好Python开发环境, PyCharm 或 Anaconda等都可以,按个人习惯喜好。
2)基本库的安装,如numpy、pandas、scipy、matplotlib
3)具备一定的Python编程技能,如果不熟悉,可选择一个教程进行学习,Python简单好上手,资源也很丰富。
菜鸟教程 Python 3 教程 http://www.runoob.com/python3/python3-tutorial.html
廖雪峰的官方网站 Python3 https://www.liaoxuefeng.com/wiki/1016959663602400
学习视频
2.本周视频学习内容:https://www.bilibili.com/video/BV1Tb411H7uC?p=1
1)P4 Python基础
2)P1 机器学习概论
机器学习是一门多领域交叉学科,涉及较多的数学知识,我们不做太多理论上的要求,如果有听不懂的地方,不要放弃,看一遍就有个印象。通过观看视频,大家对课程有个总体的认识。
建议大家边看边做笔记,记录要点及所在时间点,以便有必要的时候回看。学习笔记也是作业的一部分。
3.作业要求:
1)贴上Python环境及pip list截图,了解一下大家的准备情况。暂不具备开发条件的请说明原因及打算
2)贴上视频学习笔记,要求真实,不要抄袭,可以手写拍照。
3)什么是机器学习,有哪些分类?结合案例,写出你的理解。
什么是机器学习:
让机器从数据中学习,进而得到一个更加符合现实规律的模型,通过对模型的使用使得机器比以往表现的更好。
机器学习的流程:数据收集-->数据清洗-->特征工程-->数据建模
分类:
监督学习:表示机器学习的数据是带标记的,这些标记可以包括数据类别、数据属性及特征点位置等。这些标记作为预期效果,不断修正机器的预测结果。
半监督:输入数据部分被标识,部分没有被标识,这种学习模型可以用来进行预测,但是模型首先需要学习数据的内在结构以便合理的组织数据来进行预测。
无监督学习:表示机器学习的数据是没有标记的。机器从无标记的数据中探索并推断出潜在的联系。
强化学习:带有激励机制的,如果机器行动正确,将施予一定的“正激励”;如果行动错误,同样会给出一个惩罚,在这种情况下,机器将会考虑如何在一个环境中行动才能达到激励的最大化,具有一定的动态规划思想。
深度学习:深度学习是一种实现这种机器学习的优秀技术,深度学习本身是神经网络算法的衍生。
案例:
半监督学习:
支持向量机
无监督学习:
k-Means算法
强化学习:
机器人控制
深度学习:
声音、图像识别