机器学习环境搭建及基础

一 环境准备

1. 创建虚拟环境

   (1) 安装virtualenv(pip install virtualenv)
   (2) 创建虚拟环境 – ml-venv (virtualenv ml-venv)
   (3) 激活虚拟环境 (cd ml-venv\scripts  回车后activate)  

2.  安装科学计算相关包

        pip install numpy
        pip install pandas
        pip install matplotlib

3. 安装scikit-learn

        pip install sklearn
        pip install scipy

4. 安装Jupyter notebook

        pip install jupyter

启动虚拟环境下cmd : jupyter notebook

二 机器学习基础——机器学习就是把无序的数据转换成有用的信息

1.概念

对于问题,无需写任何专门的代码,泛型算法(Generic Algorithms) 能对提供的数据得出一些有意思的结论。不用编码, 将数据输入泛型算法当中,它就会在数据的基础上建立出它自己的逻辑。

2.原理

打比方:学习算法是种子,数据是土壤,被掌握的程序是成熟的作物。机器学习专家就像农民,播下种子,灌溉,施肥,留意作物的生长状况。

3.机器学习案例

1.Google搜索引擎
2.垃圾邮件过滤(spam,nospam)
3.网易云音乐每日推荐
4.天气预报
5.社交网络恶意评论管理
6.......

4.人工智能与机器学习的关系

(1) 机器学习是一种人工智能的实现方法,深度学习是机器学习的一种技术

(2)机器学习是人工智能的子集,深度学习是机器学习的子集

5.人工智能的目的

教会计算机做现在人类能做的事,并且做得更好。

6.算法分类

(1)监督式学习 :已经知道问题的答案并且可以反向找出解题的逻辑

•分类:主要任务是将实例数据划分到合适的分类中
•回归:预测数值型数据(数据拟合曲线:通过给定数据点最优拟合曲线)
(2)非监督式学习

•聚类:将数据集合分成由类似的对象组成的多个类的过程称为聚类
•密度估计:将寻找描述数据统计值的过程称之为密度估计
说明:数据没有类别信息,也不会给定目标值,非监督学习还可以减少数据特征的维度,以便于我们可以使用二维或三维图形更加直观的展示数据信息;
(3)强化学习

7.算法用途

8.算法选择

9.实现步骤

(1) 程序化
(2) 自动化
(3) 智能化
     神经网络 :每一个节点都知道如何收集一组收据,找到它们的权重,做出对应的输出值(价格预测)
     递归神经网络(RNN):每次使用神经网络的时候都会对它进行升级,这使得让它能跟根据最近浏览的信息更新它的预测。如果数据记忆足够大的话,它甚至能够模拟出长期的规律
     神经元:制造一个 权重 * 因素 简单算法,这个算法叫做神经元。

10.关键术语

特征/属性
•目标变量
•实例
•分类
•样体集
•训练集
•训练样本
•测试数据
•知识表示

11.开发机器学习应用程序的步骤

1.收集数据
2.准备输入数据
3.分析输入数据
4.训练算法
5.测试算法
6.使用算法

 

posted @ 2018-03-21 11:30  ·卿欢·  阅读(845)  评论(0编辑  收藏  举报