随笔分类 - 机器学习实战

KNN和K-means的区别

摘要：knn 算法思路：如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别，则该样本也属于这个类别。 k近邻模型的三个基本要素： k-means 算法步骤：1. 从n个数据中随机选择 k 个对象作为初始聚类中心；2. 根据每个聚类对象的均值（中心对象），计算每个数据点阅读全文

posted @ 2019-08-25 07:56 一颗蘋果阅读(1561) 评论(0) 推荐(0) 编辑

对无相关性的样本特征进行onehot编码

摘要：数据集为：材料刀具能耗金菜刀 100银柴刀 98铜水果刀 74金铅笔刀 81铜菜刀 120金水果刀 99 另一种分割数据集的方式，使用sklearn中自带的分割函数：阅读全文

posted @ 2019-07-23 18:35 一颗蘋果阅读(457) 评论(0) 推荐(0) 编辑

adaboost详解

摘要：集成学习方法通过组合多个弱基分类器来实现强分类器目的，从而提高分类性能。集成学习是一类算法，并不是指一个算法。集成学习策略有非常多种，包括数据层面、模型层面和算法层面三个方面集成，这方面由于研究非常广泛，论文非常多，可以去知网下载硕博论文，论文总结非常全面。常用的两种集成学习方法是：bagging 阅读全文

posted @ 2019-07-13 15:22 一颗蘋果阅读(2582) 评论(0) 推荐(0) 编辑

K近邻算法核心函数详解

摘要：用断点来查看程序执行过程：第一轮过后：classCount内开始有数据了最终结果：阅读全文

posted @ 2019-07-09 14:57 一颗蘋果阅读(675) 评论(0) 推荐(0) 编辑

kNN之手写数字识别

摘要：import numpy as np # listdir()列出给定目录的文件名 from os import listdir import operator # inX-分类的输入向量,dataSet-输入的训练样本集,labels-标签向量,k-近邻数 def classify0(inX, dataSet, labels, k): dataSetSize = dataSet.sh... 阅读全文

posted @ 2019-05-02 13:56 一颗蘋果阅读(263) 评论(0) 推荐(0) 编辑

KNN 约会网站配对

摘要：# coding=utf-8 # kNN-约会网站约友分类 from numpy import * import matplotlib.pyplot as plt import matplotlib.font_manager as font import operator # 【1】获取数据 def init_data(): # 打开训练集文件 f = open(r"da... 阅读全文

posted @ 2019-05-02 13:40 一颗蘋果阅读(421) 评论(0) 推荐(0) 编辑

公告

昵称：一颗蘋果
园龄： 6年4个月
粉丝： 12
关注： 17

+加关注

2025年3月

日

一

二

三

四

五

六

一颗蘋果

随笔分类 - 机器学习实战

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论