随笔分类 -  机器学习实战

摘要:knn 算法思路:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 k近邻模型的三个基本要素: k-means 算法步骤:1. 从n个数据中随机选择 k 个对象作为初始聚类中心;2. 根据每个聚类对象的均值(中心对象),计算每个数据点 阅读全文
posted @ 2019-08-25 07:56 一颗蘋果 阅读(1561) 评论(0) 推荐(0) 编辑
摘要:数据集为: 材料 刀具 能耗金 菜刀 100银 柴刀 98铜 水果刀 74金 铅笔刀 81铜 菜刀 120金 水果刀 99 另一种分割数据集的方式,使用sklearn中自带的分割函数: 阅读全文
posted @ 2019-07-23 18:35 一颗蘋果 阅读(457) 评论(0) 推荐(0) 编辑
摘要:集成学习方法 通过组合多个弱基分类器来实现强分类器目的,从而提高分类性能。集成学习是一类算法,并不是指一个算法。集成学习策略有非常多种,包括数据层面、模型层面和算法层面三个方面集成,这方面由于研究非常广泛,论文非常多,可以去知网下载硕博论文,论文总结非常全面。常用的两种集成学习方法是:bagging 阅读全文
posted @ 2019-07-13 15:22 一颗蘋果 阅读(2582) 评论(0) 推荐(0) 编辑
摘要:用断点来查看程序执行过程: 第一轮过后:classCount内开始有数据了 最终结果: 阅读全文
posted @ 2019-07-09 14:57 一颗蘋果 阅读(675) 评论(0) 推荐(0) 编辑
摘要:import numpy as np # listdir()列出给定目录的文件名 from os import listdir import operator # inX-分类的输入向量,dataSet-输入的训练样本集,labels-标签向量,k-近邻数 def classify0(inX, dataSet, labels, k): dataSetSize = dataSet.sh... 阅读全文
posted @ 2019-05-02 13:56 一颗蘋果 阅读(263) 评论(0) 推荐(0) 编辑
摘要:# coding=utf-8 # kNN-约会网站约友分类 from numpy import * import matplotlib.pyplot as plt import matplotlib.font_manager as font import operator # 【1】获取数据 def init_data(): # 打开训练集文件 f = open(r"da... 阅读全文
posted @ 2019-05-02 13:40 一颗蘋果 阅读(421) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示