机器学习的机器学习?不,当我弄清楚发生了什么时,ML 笑了

机器学习的机器学习?不,当我弄清楚发生了什么时,ML 笑了

from sable diffusion

这是一个鼓舞人心的介绍的占位符,关于机器学习有多神奇以及我有多想学习它。插入改变世界、帮助人们、制造酷事物的喋喋不休。

如果你来这里是为了获得新的技术知识,那你就来错地方了。如果您是作为经验丰富的 ML 从业者来到这里的,那么您来错地方了。如果你来这里学习 CNN 的工作原理,这绝对是错误的地方,你睡够了吗?

但是,如果你想阅读一个随意的开发日志,或者如果你对 ML 超级、超级新手,这里有一份自学 AI/ML/深度学习大约一个月后的报告。这是我跟踪我的进度的条目,但我希望它可以作为一个月前的我的资源。我会模糊地详细说明他们可以期待什么以及他们应该知道什么。

我非常非正式地说“一个月”——整个夏天,我看了一些 fast.ai 的讲座,我已经对神经网络有所了解。然而,我已经在 UT Austin 学习计算机科学一个月了,在那里我开始认真学习(我每天可以分配大约 2-3 小时)。

以下是我的见解和意见。不管正确与否,他们来了:

机器学习就像你做的一样令人难以抗拒

互联网有 很多 自由的 培训班 教授人工智能。事实上,我认为它有 太多。 有无数个项目可供您选择以练习您的 ML 技能,这无济于事。哦,是的,你应该使用什么语言?您应该在哪些平台上开发?你应该学习哪些主题?你应该掌握什么数学?和 和 和 和 和 和 和 和

and and and and and

所有这些都可能成为非凡的时间汇。对我来说,它们是阻止我移动的时间槽 根本 .你可以通过数百种不同的方式学习机器学习,如果你花太长时间试图找出你想学习的方式,那将是压倒性的,而且是徒劳的。

这是我正在积极学习做的第一件事:闭嘴继续努力 某物 富有成效的。

就个人而言,我注意到自己内心有很多潜意识的压力,试图确保我的学习尽可能地达到最佳状态——我是否正在学习尽可能少复习的课程?我正在浏览的这个笔记本是否能最大限度地适用于我?

对于某些人来说,这些可能都是要问的基本问题。但是当我们提出这些问题时,我们——我和你,如果你正在阅读这篇文章,很可能是初学者。我们的机器学习世界地图完全是空的,但我们正试图绘制出通往我们尚未完全意识到的目的地的最快路线。如果我愿意,我什至不能告诉你机器学习的“南北”!

我发现我做的更多 ** 迅速地** 找到一些东西 富有成效的 供我学习。就是这样——这是你唯一需要的酒吧。它不一定是“最”富有成效的,你永远不会发现这一点。它不必是“最快”的资源,可能有一个更快的资源。不过找点东西。然后开始工作。

您将花费更少的时间来迷惑自己 做和花费更多的时间 正在做 .

我直接跳入的一些事情你也可以直接跳入:

你不是在犯复杂的错误,而是在犯愚蠢的错误

我“直接进入”的项目是 2022 年 9 月表格游乐场系列 竞赛。我为自己设定了一个挑战,即每天改进我的条目,从那以后我一直在摸索。

大部分工程都被 fast.ai 等高级库抽象出来。我正在做的特征工程也不难。

这导致了另一点:模型中最显着的改进可能是低调且非常简单的——您根本没有在会出现复杂问题的水平上工作。

因此,幸运的是(或不幸地),您的错误可能只是愚蠢的错误。

例如,即使经过两周的比赛,我 只是 对于我的训练和测试数据的每一行,我将月份放入“日”列,这意味着我依赖于日列的所有其他特征都是不正确的,实际上是随机的。因此,我的模型是在不正确的、部分随机的数据上训练的。惊喜,惊喜,当我发现这个错误时,我的最终损失减少了百分之二十以上!

哦,那我花了将近一个小时的编码才意识到我正在制作一个分类模型而不是回归模型呢?

想办法退后一步,清理愚蠢的错误。我还没有遇到使用高级调整或更改无法解决的问题。这并不是因为我无法做出复杂的改进——而是因为我还没有足够的知识来解决它们。

相反,我的比赛场地是初学者的场地,这就是我所犯的改进和错误。

你不是在创造,你是在试验

参加比赛时,我有一个先入之见,即我的作品会随着我学到的越来越多,不断地改进我的创作,从而不断地变得越来越好。我会看着损失一步一步地下降,我的排名越来越接近顶部。

哈哈哈哈哈哈没有。

A baby panda scientist, because why not

在这个初学者阶段,我们还是婴儿,将随机数、库和模型放在一起,希望某些功能可以发挥作用。我们是婴儿科学家,正在试验一堆我们可能还无法完全理解的工具。我们的每个实验都教会了我们更多关于 ML 工程的知识,并让我们对我们可以期待什么有了更多的直觉。

我的一个实验产生了一个可以让我进入的提交 倒数第二名 .

我的一个实验部分复制了另一个人的时间序列预测梯度提升树方法,并且得分高于我所有其他深度学习模型(到目前为止,仍然是我最好的提交)。

我的大部分实验都是平淡无奇、平淡无奇、平淡无奇的。不过也不是没用。我每次都学一点。

考虑到这种尝试的想法,我发现将自己内化为学习者非常有帮助 一个偷窃者。简直有 s 创建模型时可以做的事情太多了; 太多了。

准备好抄袭他人的想法、功能、模型和灵感。你没有创造任何原创的东西——你还没有,我们是祈祷奇迹的婴儿。在竞赛的讨论部分花费大量时间寻找可以使用的数据集、可以复制的功能以及可以复制的方法。在线查找文章并扭曲其代码以适合您的代码。查看其他人制作了哪些类型的 ML 模型,然后自己重​​新制作它们。

这不仅是正常的,而且是 鼓励。 这是我学得最好的方式。

下一步是什么?

我不知道,老实说。我已经完成了第一部分 快速.ai 当然,但我绝对可以使用它的第二次直通。我没有一个项目来展示我的新技能(这也是我写这篇文章的部分原因),我不确定我是否想继续参加 Kaggle 比赛(我现在在第 50 个百分位)。

我也可能会开始处理深度学习的更高级方面和 记录我的笔记和见解 .

或者,也许我只是拖着自己去获得机器学习的当当认证。太糟糕了,我不喜欢仅仅为了表明能力而获得认证。

无论如何,我会继续花时间学习人工智能。这很有趣,我应该能够跟上我的步伐!我希望在一个月内再写一篇后续文章;到那时我应该做一些很酷的事情。再见。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明

本文链接:https://www.qanswer.top/37998/30071913

posted @ 2022-09-19 13:31  哈哈哈来了啊啊啊  阅读(69)  评论(0编辑  收藏  举报