1-机器学习-机器学习概述

总结

　　人工智能和机器学习的区别：机器学习可以实现人工智能

　　机器学习概念：机器学习就是利用样本数据进行一系列分析得到一个数据模型。这个模型可以对未知数据进行预测或分类

　　模型：对数据进行一系列分析后得到的产物，模型，模型存在的意义就是对未知数据进行预测

　　训练模型：将样本数据进行分析，训练他们，得到训练后的产物，模型

　　样本数据：特征数据和标签数据

　　模型分类

- 有监督学习：样本数据包含特征数据和标签数据
- 无监督学习：样本数据只包含特征数据

　　样本数据载体：存储csv文件中

　　　　不用数据库的原因：数据库存储数据格式不符合机器学习数据格式；

　　　　　　　　　　　　　　量级大的文件数据库无法高效读写。

机器学习简介

祖师爷
- 艾伦.图灵，人工智能之父。其最大的成就就是图灵测试。一个人和一个机器跟你去聊天，你不知道对方是人还是机器，如果经过聊天后，你分辨不出谁是人谁是机器则说明这个机器通过了图灵测试。

人工智能和机器学习的区别？
- 机器学习是实现人工智能的一种技术手段(机器学习可以实现人工智能)

什么是机器学习？
- 官方解释：
  - 机器学习就是从【数据】中自动分析获得【规律（模型）】，并利用规律对未知数据进行【预测】。
- 我的解释：
  - 对样本数据(特征数据和标签数据)进行分析，得到数据的规律，利用这个规律对未知数据进行预测或分类

老师的的解释
- 模型：特殊的对象。在对象内部已经被集成或者封装好了某种形式的算法/方程式,只不过该方程还没有求出解。(一个未求出解的方程的解对象)
- 模型的作用：
  - 实现对未知数据的预测和分类。（方程的解可以对未知的数据进行预测和分类）
- 样本数据：
  - 特征：自变量。楼层采光率面积
  - 标签：因变量。售价
  - 样本数据和模型之间的关联？
    - 训练模型：将样本数据带入到模型，使得模型中的方程可以求出解。（将数据带入方程得到解）
    - 模型实现的预测或者分类其实就是模型中方程计算出来的结果。（模型的解的作用对未知数据预测或分类）
- 模型的分类：
  - 有监督学习
    - 如果模型需要的样本数据必须包含特征数据和标签数据的模型，属于有监督学习分类。
  - 无监督学习
    - 模型需要的样本只需要包含特征数据即可。

样本数据（数据集）的载体：
- 通常情况下历史数据都不会存储在数据库中，而是存储在文件中（csv文件）
- 数据库存储数据存在的问题：
  - 性能瓶颈：数据量级大的数据很难存储和进行高效的读写。
  - 数据存储格式不符合机器学习要求的数据格式

样本数据的获取途径：
- kaggle：数据竞赛平台。
- UCI数据集：是一个常用的机器学习标准测试数据集，是加州大学欧文分校(University of CaliforniaIrvine)提出的用于机器学习的数据库
- sklearn

为什么需要机器学习
- 解放生产力：比如智能客服（不知疲倦24小时工作，还不用支付其工资）可以代替人工客服。
- 解决专业问题：比如医疗方面的【ET医疗】，可以辅助医生进行相关症状的判断，数据显示，人类医生的平均准确率为60%-70%，而当下算法的准确率已经达到85%。
- 提供社会便利：杭州的城市大脑，无人超市等等。

机器学习的价值体现
- 价值体现在各个方面：医疗，航空，教育，物流，电商......
- 让机器学习程序替换手动的步骤，减少企业的成本也提高企业的效率。
- 例子：汽车销售在对新车进行推广的时候，一般都是将宣传手册投放给了所有的客户，从中进行目标客户的定位。但是如果使用机器学习对客户进行指定分类，然后将手册可以根据分类投放到不同类别的客户中，则这样就大大增加了商业机会。

　　

posted @ 2020-07-20 15:25 电竞杰森斯坦森阅读(378) 评论(0) 收藏举报

刷新页面返回顶部