机器学习环境搭建及基础
一 环境准备
1. 创建虚拟环境
(1) 安装virtualenv(pip install virtualenv)
(2) 创建虚拟环境 – ml-venv (virtualenv ml-venv)
(3) 激活虚拟环境 (cd ml-venv\scripts 回车后activate)
2. 安装科学计算相关包
pip install numpy
pip install pandas
pip install matplotlib
3. 安装scikit-learn
pip install sklearn
pip install scipy
4. 安装Jupyter notebook
pip install jupyter
启动虚拟环境下cmd : jupyter notebook
二 机器学习基础——机器学习就是把无序的数据转换成有用的信息
1.概念
对于问题,无需写任何专门的代码,泛型算法(Generic Algorithms) 能对提供的数据得出一些有意思的结论。不用编码, 将数据输入泛型算法当中,它就会在数据的基础上建立出它自己的逻辑。
2.原理
打比方:学习算法是种子,数据是土壤,被掌握的程序是成熟的作物。机器学习专家就像农民,播下种子,灌溉,施肥,留意作物的生长状况。
3.机器学习案例
1.Google搜索引擎
2.垃圾邮件过滤(spam,nospam)
3.网易云音乐每日推荐
4.天气预报
5.社交网络恶意评论管理
6.......
4.人工智能与机器学习的关系
(1) 机器学习是一种人工智能的实现方法,深度学习是机器学习的一种技术
(2)机器学习是人工智能的子集,深度学习是机器学习的子集
5.人工智能的目的
教会计算机做现在人类能做的事,并且做得更好。
6.算法分类
(1)监督式学习 :已经知道问题的答案并且可以反向找出解题的逻辑
•分类:主要任务是将实例数据划分到合适的分类中
•回归:预测数值型数据(数据拟合曲线:通过给定数据点最优拟合曲线)
(2)非监督式学习
•聚类:将数据集合分成由类似的对象组成的多个类的过程称为聚类
•密度估计:将寻找描述数据统计值的过程称之为密度估计
说明:数据没有类别信息,也不会给定目标值,非监督学习还可以减少数据特征的维度,以便于我们可以使用二维或三维图形更加直观的展示数据信息;
(3)强化学习
7.算法用途
8.算法选择
9.实现步骤
(1) 程序化
(2) 自动化
(3) 智能化
神经网络 :每一个节点都知道如何收集一组收据,找到它们的权重,做出对应的输出值(价格预测)
递归神经网络(RNN):每次使用神经网络的时候都会对它进行升级,这使得让它能跟根据最近浏览的信息更新它的预测。如果数据记忆足够大的话,它甚至能够模拟出长期的规律
神经元:制造一个 权重 * 因素 简单算法,这个算法叫做神经元。
10.关键术语
•特征/属性
•目标变量
•实例
•分类
•样体集
•训练集
•训练样本
•测试数据
•知识表示
11.开发机器学习应用程序的步骤
1.收集数据
2.准备输入数据
3.分析输入数据
4.训练算法
5.测试算法
6.使用算法