机器学习模型

机器学习模型

在 MySkill 继续学习,最后教授的材料是关于机器学习的。在这篇文章中,我将分享机器学习的一个概念或一个粗略的想法。我想分享一下如何一步一步地在python中构建机器学习模型,但我仍然需要了解它。因为这对我来说也很难:(

作为数据科学家,我们需要了解构建机器学习模型。如果您查看数据科学家的职位空缺,其中一项要求是具备机器学习方面的专业知识。因为数据科学家所做的任务是使用机器学习构建算法模型。

在我们建立机器学习模型之前,我们需要知道机器学习是什么,机器学习的类型,以及机器学习是如何工作的。

什么是机器学习?

赫伯特·亚历山大·西蒙
“机器学习关注的是通过经验自动提高性能的计算机程序。”

因此,可以说机器学习是一种无需用户指导即可自行学习的机器。

我们什么时候使用机器学习?

在处理确定性解决方案不足的复杂任务时
示例:识别语音/图像

构建个性化系统时
示例:推荐和个性化

处理难以跟踪的任务时
示例:例如,自动驾驶、欺诈检测

机器学习应用示例
预言: 移动贷款服务,可预测付款失败的可能性
图像识别: 人脸识别
金融业: 欺诈调查和信用检查。

机器学习的类型

有两种常用的机器学习类型

什么是目标列?目标列是要预测的列。

监督学习的类型

  1. 分类
  2. 回归

无监督学习的类型

  1. 聚类

它是如何工作的?

我们想预测鸢尾花的种类。因为数据有标签,所以使用的机器学习类型是监督学习。那么如何确定要使用的模型呢?什么是回归?还是分类?甚至任何其他模型?你需要一一尝试,然后比较哪个结果更好

物种 column 将用作要预测的列。机器学习会自行从其他列或通常所说的特征中学习。

例如,如果萼片长度 3.7,萼片宽度 3.0,花瓣长度 5.5,花瓣宽度 2.5,那么物种类型是什么?从特征来看,机器可以预测物种的类型,无论是 setosa、virginica 还是 versicolor。

构建机器学习

你要做的第一件事是 EDA(探索性数据分析)。 然后,之后你可以做建模算法。如果模型评估的结果很好,那么最后一步就是部署。

您通常在数据预处理中做什么?

数据准备
- 检查行数和列数
- 检查数据类型
- 检查缺失值
- 检查描述性统计
- 检查分布
- 检查相关性
- 检查异常值
- 检查重复

在此步骤中,您必须准备数据。数据有问题吗?缺失值、异常值、错误标签示例

如果有缺失值怎么办?

您有 2 个选项:
1.删​​除数据
2. 估算数据

你在特征工程中通常做什么?

有2种:
1. 转换功能(例如,将日期转换为工作日、标准化)
2. 特征创建(例如,文本的 n-gram,如果单词被大写以检测名称等)

谢谢!

https://machinelearningknowledge.ai/python-libraries-for-machine-learning-beginners-guide/

Python 中的机器学习——PyImageSearch

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明

本文链接:https://www.qanswer.top/37906/02051911

posted @ 2022-09-19 11:02  哈哈哈来了啊啊啊  阅读(83)  评论(0编辑  收藏  举报