作业1——机器学习概述

本周任务:

一、python基础的准备

1、安装好Python开发环境, PyCharm 或 Anaconda等都可以,按个人习惯喜好。

 

 

 

2、基本库的安装,如numpy、pandas、scipy、matplotlib

 

 

二、本周视频学习内容:https://www.bilibili.com/video/BV1Tb411H7uC?p=1

1、P4 Python基础

(1)强制转换问题

 

 (2)arange和range的区别

 

 (3)logspace

 

 (4)设置pycharm控制台输出长度

 

 (5)二维数组去重问题

二维数组直接采用Unique去重会先将二维数组变成一维数组再进行去重,不符合需求。故,

方法一:转换为虚数再进行去重。

 

方法二:将二维数组转化为元组再放入集合中

 

(6)堆叠np.stack(),根据axis不同堆叠效果不同。

 

(7)矩阵相乘 ≠ a*b

矩阵乘法

 

对应元素相乘

 

 

 

 

2、P1 机器学习概论

(1)概念:机器学习是AI的一个分支,设计一个计算机系统,根据提供的数据按一定方式学习,随着训练次数增加,可以在性能上不断学习和改进,通过参数优化学习模型。

      【×】大数据存储/并行计算/机器人

(2)分类:机器学习包括有监督学习,无监督学习和增强学习(9’38

  有监督学习——通过已有数据对(x,y)判断新数据(x)y值。

    ·例子:儿童经过多次训练学到月亮这个概念,之后能够判断某事物是否为月亮。

  无监督学习——判断不完全独立的数据之间的关系,p(x)p(y)p(xy)。(聚类)

    ·例子:词库经过训练组合得到新词,根据词语组合的概率得到新词。

(3)作用:1)清洗数据/特征选择;2)确定算法模型/参数优化;3)结果预测 (21’00

 

(4)传统算法和机器学习

【区别】做某些规则时采用传统算法;运用某些规则则是机器学习

 

(5)多元线性回归模型:构建一个根据多个影响因素预测到的值无限接近实际值的模型。

 

(6)无限迭代使得损失函数(目标函数)最低,模型达到最优。

 

(7)机器学习的一般流程:数据收集数据清洗→特征工程(特征选择、调参)→数据建模→预测(37’39

  【注】清洗和特征工程实际工作量较大

 

(8)机器学习方法:

  1)利用各种算法对数据进行分类

    Linear SVM / RBF SVM / Decision Tree / Naive Bayes / Linear Discrimination / QDA / AdaBoast / Random Forest

  2)采用不同的可延展的配置文件训练模型

  3)适当调整损失函数使预测数据达到最优

  4)设计模型的大小适应不同设备

 

 * 泰勒公式——预测ex的值 / 考察Gini系数的图像(梯度下降法)

 * Γ函数   

 

 

 * 凸函数  

 

 

 

 

 

 

 

 

 

 

 

 

 * Soft-max 回归

 

 

 

 

 * 古典概型——生日悖论 / 装箱问题 → 熵(混乱程度的反映——决策树、随机森林)

 

 

 

总结:什么是机器学习?有什么分类

(1)概念:机器学习是让计算机从较多的数据中提取出有用的信息,最后拥有决策判别的能力。

 

(2)分类

 · 监督学习:其特点是在训练模型时明确标记每个数据点的正确结果,以便找它们之间的关系,确保在引入未分配的数据点时,可以正确的做出预测或分类。如在对股票价格的研究中,分析数据点之间的关系,可以用回归学习算法对下个数据点做出预测。

 

 · 无监督学习:该类学习的特征是算法在训练模型时期不对结果进行标记,而直接在数据点之间找有意义的关系,它的价值在于发现模式以及相关性。如,一个喜欢这瓶酒的人也喜欢这一个。

 

 · 强化学习:这种类型的学习是有监督学习和无监督学习的结合。它通常用于解决更复杂的问题。在实践中,该类学习类型可应用于控制机器人手臂、找到最有效的电机组合、机器人导航等领域。同时逻辑游戏也很适合强化学习如扑克等。强化学习的其他应用在物流、日程安排和任务的战略规划中也很常见。

 

 

 

 

引用:https://www.zhihu.com/question/19830921
posted @ 2020-04-05 17:39  酒大暗  阅读(216)  评论(0编辑  收藏  举报