1-机器学习-机器学习概述
总结
人工智能和机器学习的区别:机器学习可以实现人工智能
机器学习概念:机器学习就是利用样本数据进行一系列分析得到一个数据模型。这个模型可以对未知数据进行预测或分类
模型:对数据进行一系列分析后得到的产物,模型,模型存在的意义就是对未知数据进行预测
训练模型:将样本数据进行分析,训练他们,得到训练后的产物,模型
样本数据:特征数据和标签数据
模型分类
-
- 有监督学习:样本数据包含特征数据和标签数据
- 无监督学习:样本数据只包含特征数据
样本数据载体:存储csv文件中
不用数据库的原因:数据库存储数据格式不符合机器学习数据格式;
量级大的文件数据库无法高效读写。
机器学习简介
- 祖师爷
- 艾伦.图灵,人工智能之父。其最大的成就就是图灵测试。一个人和一个机器跟你去聊天,你不知道对方是人还是机器,如果经过聊天后,你分辨不出谁是人谁是机器则说明这个机器通过了图灵测试。
- 人工智能和机器学习的区别?
- 机器学习是实现人工智能的一种技术手段(机器学习可以实现人工智能)
- 什么是机器学习?
- 官方解释:
- 机器学习就是从【数据】中自动分析获得【规律(模型)】,并利用规律对未知数据进行【预测】。
- 我的解释:
- 对样本数据(特征数据和标签数据)进行分析,得到数据的规律,利用这个规律对未知数据进行预测或分类
- 官方解释:
- 老师的的解释
-
模型:特殊的对象。在对象内部已经被集成或者封装好了某种形式的算法/方程式,只不过该方程还没有求出解。(一个未求出解的方程的解对象)
-
模型的作用:
- 实现对未知数据的预测和分类。(方程的解可以对未知的数据进行预测和分类)
-
样本数据:
- 特征:自变量。楼层 采光率 面积
- 标签:因变量。售价
- 样本数据和模型之间的关联?
- 训练模型:将样本数据带入到模型,使得模型中的方程可以求出解。(将数据带入方程得到解)
- 模型实现的预测或者分类其实就是模型中方程计算出来的结果。(模型的解的作用对未知数据预测或分类)
- 模型的分类:
- 有监督学习
- 如果模型需要的样本数据必须包含特征数据和标签数据的模型,属于有监督学习分类。
- 无监督学习
- 模型需要的样本只需要包含特征数据即可。
- 有监督学习
-
- 样本数据(数据集)的载体:
- 通常情况下历史数据都不会存储在数据库中,而是存储在文件中(csv文件)
- 数据库存储数据存在的问题:
- 性能瓶颈:数据量级大的数据很难存储和进行高效的读写。
- 数据存储格式不符合机器学习要求的数据格式
- 样本数据的获取途径:
- kaggle:数据竞赛平台。
- UCI数据集:是一个常用的机器学习标准测试数据集,是加州大学欧文分校(University of CaliforniaIrvine)提出的用于机器学习的数据库
- sklearn
- 为什么需要机器学习
- 解放生产力:比如智能客服(不知疲倦24小时工作,还不用支付其工资)可以代替人工客服。
- 解决专业问题:比如医疗方面的【ET医疗】,可以辅助医生进行相关症状的判断,数据显示,人类医生的平均准确率为60%-70%,而当下算法的准确率已经达到85%。
- 提供社会便利:杭州的城市大脑,无人超市等等。
- 机器学习的价值体现
- 价值体现在各个方面:医疗,航空,教育,物流,电商......
- 让机器学习程序替换手动的步骤,减少企业的成本也提高企业的效率。
- 例子:汽车销售在对新车进行推广的时候,一般都是将宣传手册投放给了所有的客户,从中进行目标客户的定位。但是如果使用机器学习对客户进行指定分类,然后将手册可以根据分类投放到不同类别的客户中,则这样就大大增加了商业机会。