#BlogWithIEEECS:机器学习 101
#BlogWithIEEECS:机器学习 101
客座作者: 阿纳斯·纳西姆 .
让我们试着理解机器学习。
在这篇文章中,我将简要介绍一些主题,为您提供关于机器学习的非常简单的介绍。
- 什么是机器学习?
- 应用
- 关键要素
- 学习类型
- 训练模型
- 中性网络——简介
如果您不是神童或来自某些先进文明,请不要担心——您需要了解的唯一知识是基本的高中数学。
什么是机器学习?
微软 将机器学习定义为:
“机器学习 (ML) 是使用数据的数学模型来帮助计算机在没有直接指令的情况下学习的过程。”
机器学习正在让计算机自行编程。如果编程是自动化,那么机器学习就是自动化自动化过程。等待。这有意义吗?
机器学习是让计算机在没有明确编程的情况下采取行动的科学。那更好吗?
可以肯定地说,机器学习的定义数量空前。
我个人喜欢将其定义为“机器学习涉及我们给计算机一些数据并告诉它从这些数据中学习”。基本上就像模仿人类一样。从经验中学习,可以这么说。这就像园艺。种子是算法,营养是数据,园丁是我们,人和植物是程序。
现在,如果定义很清楚,我们可以继续使用一些实际应用程序更好地理解。
机器学习的应用
我们可以在现实世界中应用机器学习的一些有趣方式:
- 网络搜索:根据您最有可能点击的内容对页面进行排名。
- 财务:决定向谁发送信用卡优惠。评估信贷报价的风险。如何决定在哪里投资。
- 电子商务:预测客户流失。交易是否欺诈。
- 太空探索:太空探测器和射电天文学。
- 机器人技术:如何处理新环境中的不确定性。自主性。自动驾驶汽车。
- 信息提取:通过网络向数据库提问。
- 社交网络:关于关系和偏好的数据。机器学习从数据中提取价值。
- 调试:用于调试等计算机科学问题。劳动密集型过程。可以建议错误可能在哪里。我们没有很多优秀的程序员。
您感兴趣的领域是什么?您如何在该特定领域使用机器学习?
机器学习的关键要素
每年有数以万计的机器学习算法和数百种新算法被开发出来。
数据集
就像我在定义中提到的那样,机器需要大量数据才能发挥作用、从中学习并最终做出决策。这些数据可以是任何可以解释和分析的未经处理的事实、价值、声音、图像、文本。
数据集准备好后,将用于训练、验证和测试 ML 模型。数据集越大,模型的学习机会就越好,实现结果准确性的机会就越高。
这就是 5V 数据发挥作用的地方。数量、品种、准确性、速度和价值。
体积 — 大数据集使模型很容易做出最优化的决策。
种类 - 数据集可以有不同形式的数据,例如图像和视频。数据的多样性对于确保结果的准确性具有重要意义。
速度 - 数据在数据集中累积的速度很重要。
价值 - 数据集应该包含有意义的信息。
真实性—— 在维护数据集时,数据的准确性很重要。
算法
只需将算法视为将数据集转换为模型的数学或逻辑程序。根据模型试图解决的问题类型、可用资源和数据性质,可以选择不同类型的算法。
资料来源:TowardsDataScience
楷模
在机器学习中,模型是现实世界过程的计算表示。通过使用相关算法在一组数据上训练 ML 模型来识别某些类型的模式。模型经过训练后,可用于进行预测。
为了更好地解释这一点,让我们举一个非常简单的例子,如果你在很长一段时间内为汽车的模型图像提供各自的名称,模型现在将能够识别新车的图像,并且随着时间的推移它能够以高精度预测汽车的名称/品牌。
训练
这也包括特征提取。您需要从数据集中输入最佳和足够的数据,并且永远不要过度拟合。过度拟合可能会损害模型的整体性能。
训练包括允许 ML 模型识别模式和做出决策的方法。有不同的方法可以实现这一点,包括监督学习、无监督学习、强化学习等。我将在本文后面介绍所有这些。
现在我们已经了解了机器学习的关键要素,让我们讨论一下各种学习方法。
学习类型
与任何方法一样,有不同的方法来训练机器学习算法,每种方法都有自己的优点和缺点。要了解每种机器学习的优缺点,我们必须首先看看它们摄取了什么样的数据。在 ML 中,有两种数据——标记数据和未标记数据。
标记数据
标记数据具有完全机器可读模式的输入和输出参数
未标记数据
未标记的数据只有一个或没有机器可读形式的参数。
今天实现了三种主要的学习方法,监督学习,无监督学习,强化学习。
监督学习
监督学习是机器学习的最基本类型之一。在这种类型中,机器学习算法是在标记数据上训练的。尽管需要准确地标记数据才能使这种方法起作用,但在正确的情况下使用监督学习是非常强大的。
基本上,监督学习是指我们使用标记良好的数据来教授或训练机器。这意味着一些数据已经标记了正确的答案。这就像给孩子展示一些东西并告诉他们它是什么,以便他们将来能够识别它。
这意味着即使在部署后,监督机器学习算法将继续改进,在新数据上训练自己时发现新的模式和关系。
无监督学习
无监督学习是使用既不分类也不标记的信息训练机器,并允许算法在没有指导的情况下对这些信息采取行动。这意味着不需要人工来使数据集机器可读,从而允许程序处理更大的数据集。
在监督学习中,标签允许算法找到任何两个数据点之间关系的确切性质。然而,无监督学习没有标签可以处理,导致隐藏结构的创建。
你给程序一个数据集,但没有说明数据集的含义。您没有为算法定义任何类型的结果。相反,它需要自己找出模式(如果有的话)。
强化学习
强化学习是通过与环境交互来学习。 RL 智能体从其行为的后果中学习,而不是从被明确教导中学习,它根据过去的经验(利用)和新的选择(探索)来选择其行为,这本质上是 试错 学习。
想想你的宠物狗。如果它做你想让它做的事情,你会给它奖励,并且对它不应该做的事情给予小惩罚/惩罚。这样,狗就学会了不再犯同样的错误。
现在我们已经了解了三种主要的学习方法是什么,我们可以继续训练模型。
训练模型
训练 ML 模型的过程涉及提供 ML 算法(即 学习算法 ) 与训练数据一起学习。期限 机器学习模型 指的是由训练过程创建的模型工件。
模型以数据的形式接受输入( X ) 并生成输出 ( 是的 ) 基于输入数据及其参数。优化算法试图找到参数的最佳组合,以便给定示例 X 模型的输出 是的 尽可能接近预期输出。训练后的模型将代表一个特定的功能 F 给定的 X 产生输出 是的 .所以: y=f(x) .
例如,假设您想训练一个机器学习模型来预测一封电子邮件是垃圾邮件还是非垃圾邮件。您将向 ML 提供包含您知道目标的电子邮件的训练数据(即,告诉电子邮件是垃圾邮件还是非垃圾邮件的标签)。然后,我们将使用这些数据训练一个 ML 模型,从而生成一个尝试预测新电子邮件是否是垃圾邮件的模型。
有 3 种类型的模型,二元分类,多类分类和回归模型。
二元分类模型
二元分类问题的 ML 模型预测二元结果(两个可能的类别之一),即真或假/是或否/1 或 0。
多类分类模型
多类分类问题的 ML 模型允许您为多个类生成预测(预测两个以上结果之一)。
回归模型
回归问题的机器学习模型预测一个数值。
现在我们已经了解了训练是如何完成的,我们可以谈谈神经网络,它是机器学习的一个子集。
神经网络——简介
科学家们一致认为,我们的大脑有大约 1000 亿个神经元。这些神经元之间有数千亿个连接。
神经元的解剖。
神经元(又名神经细胞)是我们大脑和神经系统的基本单位。神经元负责接收来自外部世界的输入,以电信号的形式发送输出(向我们的肌肉发出命令)。
树突作为神经元的一部分,接受多个“输入”信号,并通过细胞体和轴突,通过末端轴突输出。这正是神经网络中神经元的工作方式——通过函数处理多个输入并输出一个值。
基本上是一个人工神经网络。从这个意义上说,神经网络是指神经元系统,无论是有机的还是人工的。
“神经网络是一系列算法,通过模仿人脑运作方式的过程,努力识别一组数据中的潜在关系。”
如果我们要将人工神经网络与生物神经网络进行比较,仍然需要进行许多改进,但我们可以清楚地看到,人工神经网络是一种受动物启发的解决方案。
一个简单的神经网络。
神经网络可以适应不断变化的输入;因此网络可以生成最好的结果,而无需重新设计输出标准。
如上图所示,ANN 中存在 3 层。
1)输入层:功能与树突类似。这一层的目的是接受来自另一个神经元的输入。
2)隐藏层:这些是执行实际操作的层
3)输出层:功能与轴突类似。该层的目的是将生成的输出传输到其他神经元。
人工神经元接收输入。这些输入具有称为“突触”的权重。这些神经元(也称为节点)具有“激活功能”。此激活函数作用于输入并对其进行处理以提供输出。
输入的加权和成为激活函数的输入信号以提供一个输出。这些输入权重是可调的,因此神经网络可以调整其参数以提供所需的输出。这里应该有多少隐藏层没有限制。它可以低至 1 或高达 1000 或几乎无限。
激活函数是神经元接收的输入函数。激活函数用于将 ANN 节点上的输入信号转换为输出信号。
在神经网络中有多个层是术语“ 深度学习 ”来自。在模型中使用多层的好处是每一层都可以使用前一层提取的信息来构建更复杂的数据表示。正因为如此,神经网络已被证明如此强大,成功地训练到 识别视频中的猫 , 识别语音 , 乃至 玩 Atari 电子游戏 .
优化算法
没有优化算法,任何机器学习算法都是不完整的。优化算法的主要目标是使我们的 ML 模型(在这种情况下为神经网络)经受一系列试错过程,最终使模型具有更高的准确性。
在神经网络的上下文中,我们使用一种称为梯度下降的特定优化算法。
梯度下降图。
这 更高 梯度, 更陡峭 坡度和 快点 一个模型可以学习。但是如果斜率为零,模型就会停止学习。在数学术语中,梯度是关于其输入的偏导数。
为了让事情简短易懂,我在这篇文章中没有涉及到更多关于优化的内容。
神经网络的类型
有许多不同类型的神经网络。这张图片中有几个最突出的。
人工神经网络的类型。
由于解释所有这些需要很长时间,我很快会在单独的帖子中介绍它们。但是,这是他们的应用程序列表。
1.卷积神经网络(CNN):用于图像识别和分类
2.人工神经网络(ANN):用于图像压缩
3.受限玻尔兹曼机(RBM):用于分类、回归、降维等多种任务
4.生成对抗网络(GAN):用于假新闻检测、人脸检测等。
5.循环神经网络(RNN):用于语音识别
6.Self Organizing Maps(SOM):用于拓扑分析
公平地说,我们现在知道神经网络的基础知识。如果您想尝试使用小型神经网络示例,请尝试 谷歌的 TensorFlow Playground .
结论
我不认为机器会接管。我不相信我们会生活在一个反乌托邦、人工智能主导的未来。我们会好起来的。我更担心程序员输入算法的数据类型——我认为人类偏见比其他任何东西都更像一个怪物。
作者保留所有权利。
跟随 Instagram 上的阿纳斯·纳西姆 .
一个 IEEE CS MUJ 出版社 出版物。
查看我们的更多博客:
75:印度军事技术的进步。
Rakshabandhan:看看这些科技界的兄弟姐妹。
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明