机器学习 —— 机器学习的动机和应用
网易公开课学习笔记
机器学习的定义
Arthur Samuel:“在不直接针对问题进行编程的情况下,赋予计算机学习能力的一个研究领域”
让计算机学会如何下棋,并超过自己
Tom Mitchell:给计算机一个任务T和性能测试方法P,如果在经验E的影响下,P对T的测量结果得到了改进,我们说程序从E中得到了学习
E(experience):程序不断和自己下棋的经历
T(task):下棋
P(performance):程序和人下棋胜出的概率
一、supervised learning(监督性学习)
学习标准输入和标准答案间的关系,给我们提供一个某种意义上的正确答案
回归问题 regression problem,需要测量的变量是连续的:房屋面积和房屋价格的关系
分类问题 classification problem,需要测量的变量是离散的:乳腺癌肿瘤数据,肿瘤大小和肿瘤是否为良性的关系(是否为良性,取值只有0或1),
通过肿瘤大小,病人年龄,肿瘤是否良性的数据来预测新输入的病人数据结果是否为良性
支持向量算法,将数据映射到无线纬的空间中,处理无限种特征
二、learning theory(学习理论)
三、unsupervised learning(无监督性学习)
聚类问题,用户画像、分类
计算机群组织、社交网络分析、市场划分
四、reinforcement learning(加强学习)
进行一次性决策,如何定义一个好的行为
应用:机器人领域、网页爬取