随笔分类 - Python机器学习
摘要:报错内容 在运行app.py文件时,出现如下图所示错误: 错误原因 pickle不能和joblib混用 因为键为空,所以应该是pkl文件并未成功加载 解决办法 出错原因为第二点,所以解决办法如下: 先在本地运行mode.py文件,以保存训练好的pkl模型 with open("clf.pkl", '
阅读全文
摘要:数据集构成:特征值+目标值 Scikit-learn包含的内容: classification分类 regression回归 clustering聚类 dimensionality reduction降维 preprocessing特征工程 模型选择、调优 如何在sklearn中实现数据集的划分:
阅读全文
摘要:获取原始数据 拿到的数据不能全部用来训练一个模型。需要划分数据集。分为训练数据(训练、构建模型)和测试数据(在模型检验时使用,用于评估模型是否有效) 划分比例:训练集70%、75%、80% 数据处理 特征工程 机器学习算法训练,得到模型 模型评估(不合格的话返回到第二步) 应用(离线/在线服务)
阅读全文
摘要:监督学习(输入数据有特征有标签,即有标准答案) 有目标值,且目标值是一个类别(特征值是猫狗的图片,目标值是猫、狗),叫做分类问题 有目标值,且是连续型的数据,~回归问题(比如预测房屋价格)特征是是低点位置朝向 目标值是房屋价格 分类比如:k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归 回归:线
阅读全文
摘要:机器学习概述 特征工程 数据集 机器学习介绍 特征抽取 特征预处理 特征降维 主成分分析 总结+每日作业 分类算法 回归与聚类算法
阅读全文