浏览器标题切换
浏览器标题切换end
摘要: 数据集构成:特征值+目标值 Scikit-learn包含的内容: classification分类 regression回归 clustering聚类 dimensionality reduction降维 preprocessing特征工程 模型选择、调优 如何在sklearn中实现数据集的划分: 阅读全文
posted @ 2021-07-19 19:58 抓水母的派大星 阅读(118) 评论(0) 推荐(0) 编辑
摘要: 获取原始数据 拿到的数据不能全部用来训练一个模型。需要划分数据集。分为训练数据(训练、构建模型)和测试数据(在模型检验时使用,用于评估模型是否有效) 划分比例:训练集70%、75%、80% 数据处理 特征工程 机器学习算法训练,得到模型 模型评估(不合格的话返回到第二步) 应用(离线/在线服务) 阅读全文
posted @ 2021-07-19 19:55 抓水母的派大星 阅读(50) 评论(0) 推荐(0) 编辑
摘要: 监督学习(输入数据有特征有标签,即有标准答案) 有目标值,且目标值是一个类别(特征值是猫狗的图片,目标值是猫、狗),叫做分类问题 有目标值,且是连续型的数据,~回归问题(比如预测房屋价格)特征是是低点位置朝向 目标值是房屋价格 分类比如:k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归 回归:线 阅读全文
posted @ 2021-07-19 19:53 抓水母的派大星 阅读(88) 评论(0) 推荐(0) 编辑
摘要: 机器学习概述 特征工程 数据集 机器学习介绍 特征抽取 特征预处理 特征降维 主成分分析 总结+每日作业 分类算法 回归与聚类算法 阅读全文
posted @ 2021-07-19 19:50 抓水母的派大星 阅读(36) 评论(0) 推荐(0) 编辑