机器学习 作业1

1. 机器学习概述


本周任务:

1.python基础的准备

本课程拟采用Python做为机器算法应用的实现语言,所以请确保:

1)安装好Python开发环境, PyCharm 或 Anaconda等都可以,按个人习惯喜好。

2)基本库的安装,如numpy、pandas、scipy、matplotlib

3)具备一定的Python编程技能,如果不熟悉,可选择一个教程进行学习,Python简单好上手,资源也很丰富。

菜鸟教程 Python 3 教程 http://www.runoob.com/python3/python3-tutorial.html 

廖雪峰的官方网站 Python3 https://www.liaoxuefeng.com/wiki/1016959663602400

学习视频

 

2.本周视频学习内容:https://www.bilibili.com/video/BV1Tb411H7uC?p=1

1)P4 Python基础

2)P1 机器学习概论

机器学习是一门多领域交叉学科,涉及较多的数学知识,我们不做太多理论上的要求,如果有听不懂的地方,不要放弃,看一遍就有个印象。通过观看视频,大家对课程有个总体的认识。

建议大家边看边做笔记,记录要点及所在时间点,以便有必要的时候回看。学习笔记也是作业的一部分。

 

3.作业要求:

1)贴上Python环境及pip list截图,了解一下大家的准备情况。暂不具备开发条件的请说明原因及打算。

python环境

 pip list

使用国内镜像,使相关包的下载更快,其中优选豆瓣pip源镜像

 

2)贴上视频学习笔记,要求真实,不要抄袭,可以手写拍照。

1.Python基础

0252Python有各种各样的安装包,安装Python包推荐工具Piphttps://pypi.python.org/pypi/pip

0633Numpy:为Python提供快速的多维数组处理能力

0657Pandas更多的是处理可视化相关的,在Numpy基础上提供了更多的数据读写工具

0725ScipyNumpy基础上添加了众多科学计算工具包

0954Python相较于CJava,可以用更简单的代码输出矩阵

1036验证中心极限定理

1051正态分布的概率密度函数

1145Poisson分布的概率质量函数

1223机器学习中的损失函数

1313各种2D曲线

13283D

1349/继承类

1516重心插值,样条插值

1655Taylor展式

1721Taylor展式应用

1815计算圆周率

1902数值计算

2538负二项分布

3413 本福特定律

3933 import导包方式介绍

4717 array创建数组

4816 shape查看数组大小

reshape创建改变了尺寸的新数组,原数组shape不变

(数组ab共享内存,修改其一将影响另一个)

5236 dtype用于数组的元素类型获取或设置

5433 astype转换元素类型

5615 使用函数创建数组arange

5904 linspace指定起始值、终止值和元素个数创建数组

6020 logspace创建等比数列

6340 数组元素存取

6520 切片

7110 np.random.rand()生成随机数

8039 numpypython数学库的时间比较

8453 元素去重,库函数np.unique():利用转换为虚数split;利用set

9825 绘图,绘制正态分布密度函数

10457 损失函数:Logistic损失(-11/SVM Hinge损失/ 0/1损失

11243 xx绘图

11434 胸型线

11607 心形线

11705 渐开线

11800 sin曲线

11834 概率分布:均匀分布,验证中心极限定理,其他分布的中心极限定理,poisson分布

13100 直方图的使用

13226 插值

133:44 绘制三维图像

2.机器学习概论

0131 机器学习与数学分析主要内容介绍,数学分析,概率论基础

0225 什么是机器学习

机器学习是人工智能的一个分支。我们使用计算机设计一个系统,使它能够根据提供的训练数据按照一定的方式来学习;随着训练次数的增加,该系统可以在性能上不断学习和改进;通过参数优化的学习模型,能够用于预测相关问题的输出。

0504 无人驾驶汽车

0938 人类的学习

1840 机器学习的内涵与外延

2148 人们对于机器学习的图文印象

2411 机器学习房屋价格例子

3519 建模

3603 预测

3726 机器学习的一般流程

数据收集—数据清洗—特征工程—数据建模

3935 机器学习方法

4203 机器如何发现新词

4250 Python Code示例

4538 机器学习示例

线性回归、rateLossEM CodeEM算法;GMM与图像;图像的卷积;去均值ICA分离;带噪声的信号分离;SVM:高斯合函数的影响;Crawler爬取数据;HMM分词:MLELDA;舆情;石油例检结果;

5504 其他内容

最大熵模型:自然语言处理解决标记问题

聚类:K-means/K-Mediods/密度聚类/谱聚类

降维:PCA/SVD/ICA

SVM:与核技术相结合

主题模型pLSA/LDA:与聚类、标签传递算法相结合

条件随机场:无向图模型,链式条件随机场解决标记问题

变分推导Variation Inference:与EM、贝叶斯相结合,参数、隐变量的学习

深度学习:大规模人工神经网络

5530 本课程参考文献(部分)

6230 对数函数的上升速度

6741 导数

6951 常用函数的导数

7123 应用1:已知f(x)=xx,x>0,f(x)最小值

7528 求解xx

7646 积分应用2

8311 Taylor公式-Maclaurin公式

8515 Taylor公式的应用1:初等函数值的计算,计算e^x

9451 Taylor公式的应用2Gini系数的图像、熵、分类误差率之间的关系

9714 方向导数

10246 梯度

10722

11446 凸函数

11906 一阶可微,二阶可微

12540 凸函数

12831 概率论,古典概型,生日悖论,装箱问题,与组合数的关系

13842 组合数背后的秘密:熵

 

3)什么是机器学习,有哪些分类?结合案例,写出你的理解。

 答:机器学习是人工智能的一个分支。我们使用计算机设计一个系统,使它能够根据提供的训练数据按照一定的方式来学习;随着训练次数的增加,该系统可以在性能上不断学习和改进;通过参数优化的学习模型,能够用于预测相关问题的输出。

 机器学习通常可以分为四种:

①监督学习:利用已标记的有限训练数据集,通过某种学习策略/方法建立一个模型,实现对新数据/实例的标记(分类)/映射。如回归分析和统计分类。

②无监督学习:利用无标记的有限数据描述隐藏在未标记数据中的结构/规律。如聚类。

③半监督学习:介于监督学习与无监督学习之间,其主要解决的问题是利用少量的标注样本和大量的未标注样本进行训练和分类,从而达到减少标注代价、提高学习能力的目的。如拉普拉斯支持向量机。

④强化学习:智能系统从环境到行为映射的学习,以使强化信号函数值最大。由于外部环境提供的信息很少,强化学习系统必须靠自身的经历进行学习。如无人驾驶。

 

 

posted @ 2020-04-02 00:14  fourn666  阅读(315)  评论(0编辑  收藏  举报