随笔分类 - 4-python / 14-python--机器学习实战
摘要:内容预告: 1.K-Means算法 2.Mean Shift算法 3.算法评估 4.python手动实现K-Means和Mean Shift 一、原理 1.什么是聚类算法? (1)聚类算法是一种非监督学习算法; (2)聚类是在没有给定划分类别的情况下,根据数据相似度进行样本分组的一种方法; (3)
阅读全文
摘要:一、实战 print("###############################step1: 导入库###########################################") import pandas as pd import numpy as np import matpl
阅读全文
摘要:一、原理 1.什么是决策树 (1)由一个根节点,若干内部节点和若干叶节点构成; (2)可以解决分类和回归问题; (3)非参数学习算法。 2.决策树的目标 通过一种衡量标准,来计算通过不同特征进行分支选择后的分类情况,找出来最好的那个特征当成根节点,以此类推。 3.两大问题 (1)每个节点在哪个维度上
阅读全文
摘要:说明: 1.本文为个人学习笔记记录; 2.学习视频来源:https://space.bilibili.com/474347248/channel/detail?cid=143235 3.数据来源:唐国梁Tommy,为了方便志同道合的伙伴一起学习,我将数据上传到个人盘分享: 链接:https://pa
阅读全文
摘要:内容简介: 利用随机森林方法训练数据集,预测泰坦尼克号哪些人可以获救,主要过程如下: step1:加载源数据集 step2: 数据清洗 step3:进行特征构建 step4:特征构建(2)基于scikit-learn中的LabelEncoder() step5:特征选择 step6:获取训练集和测试
阅读全文