随笔分类 -  机器学习

摘要:机器学习04 机器学习-04集合算法AdaBoost模型(正向激励)特征重要性GBDT自助聚合随机森林 分类模型什么问题属于分类问题?逻辑回归 代码总结波士顿房屋价格数据分析与房价预测训练回归模型,预测房屋价格决策树回归正向激励GBDT随机森林案例:共享单车投放量分析与预测训练机器学习模型,预测共享 阅读全文
posted @ 2023-02-18 16:56 野哥李 阅读(73) 评论(0) 推荐(0) 编辑
摘要:机器学习-06 机器学习-06支持向量机(SVM)支持向量机原理网格搜索 情感分析文本分词词袋模型词频(TF)文档频率(DF)逆文档频率(IDF)词频-逆文档频率(TF-IDF)文本分类(主题识别)朴素贝叶斯分类 代码总结支持向量机SVM线性核函数SVM多项式核函数径向基核函数网格搜索 NLP情感分 阅读全文
posted @ 2023-02-10 14:48 野哥李 阅读(23) 评论(0) 推荐(0) 编辑
摘要:机器学习-07 机器学习-07中文分词(jieba)样本类别均衡化置信概率聚类模型K均值算法均值漂移算法轮廓系数DBSCAN算法 推荐引擎代码总结结巴分词酒店评论舆情分析针对测试样本进行测试 聚类模型kMeans均值漂移DBSCAN 机器学习-07 中文分词(jieba) https://githu 阅读全文
posted @ 2023-02-03 21:35 野哥李 阅读(39) 评论(0) 推荐(0) 编辑
摘要:jieba “结巴”中文分词:做最好的 Python 中文分词组件 “Jieba” (Chinese for “to stutter”) Chinese text segmentation: built to be the best Python Chinese word segmentation 阅读全文
posted @ 2022-09-14 08:26 野哥李 阅读(15) 评论(0) 推荐(0) 编辑
摘要:1 概述 注意这是数据预处理中的方法: Fit(): Method calculates the parameters μ and σ and saves them as internal objects. 解释:简单来说,就是求得训练集X的均值啊,方差啊,最大值啊,最小值啊这些训练集X固有的属性。 阅读全文
posted @ 2020-07-08 17:18 野哥李 阅读(38) 评论(0) 推荐(0) 编辑
摘要:机器学习-05 机器学习-05分类模型逻辑回归数据集划分交叉验证混淆矩阵分类报告 决策树分类验证曲线学习曲线 代码总结训练机器学习模型,预测共享单车使用量模型选择模型评估- 混淆矩阵模型评估-分类报告小汽车评级01机器学习主流过程小汽车评级02 机器学习-05 分类模型 逻辑回归 数据集划分 对于分 阅读全文
posted @ 2020-07-08 11:16 野哥李 阅读(58) 评论(0) 推荐(0) 编辑
摘要:机器学习-02 回归模型线性回归评估训练结果误差(metrics)模型的保存和加载 岭回归多项式回归 代码总结线性回归绘制图像,观察w0、w1、loss的变化过程以等高线的方式绘制梯度下降的过程薪水预测评估误差把训练好的模型存入文件 加载模型封装预测模型对象,提供薪资预测服务 岭回归如何选择合适的超 阅读全文
posted @ 2020-07-04 15:51 野哥李 阅读(67) 评论(0) 推荐(0) 编辑
摘要:机器学习-01 机器学习概述什么是机器学习为什么需要机器学习机器学习的问题机器学习的种类机器学习的一般过程机器学习的典型应用机器学习的基本问题 数据预处理均值移除(标准化)范围缩放归一化二值化独热编码(onehot)标签编码 回归模型线性回归 代码总结数据预处理均值移除范围缩放归一化二值化独热编码标 阅读全文
posted @ 2020-07-03 14:36 野哥李 阅读(28) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示