随笔分类 - 数据建模与挖掘
侧重数据挖掘,模型算法原理推导, ML等.
摘要:核函数(Kernel) 的 SVM, 解决线性不可分问题.
阅读全文
摘要:Max Margin svm 即Suport Vector Machine, 中文意为: 支持向量机 . 对于 二分类 问题, 在样本空间中(即便是多维向量, 在空间中可表示为一个点). svm的核心思想就是 假设在这2波点的边缘处, 能找到一条直线 , 能够把这2波点分开,
阅读全文
摘要:对偶(Duality)问题 KKT 条件
阅读全文
摘要:初步认识求解LP用单纯形算法
阅读全文
摘要:
阅读全文
摘要:认识LP 线性规划(Linear Programming) 特指目标函数和约束条件皆为线性的最优化问题. 目标函数: 多个 变量 形成的函数 约束条件: 由多个 等式/不等式 形成的约束条件 线性规划: 在 线性约束条件下,目标函数求极值的问题 可行解: 满足线性约束条件下的解 可行域: 所有可行解
阅读全文
摘要:skleran 处理流程 获取数据 以用sklearn的内置数据集, 先导入datasets模块. 最经典的iris数据集作为例子. 手写数字数据集 (load_digits) 包含1797个0 9的手写数字数据, 每个数据由8 x 8大小的矩阵构成, 矩阵中值的范围是0 16, 代表颜色的深度.
阅读全文
摘要:认识 sklearn 官网地址: https://scikit learn.gor/stable/ 从2007年发布以来, scikit learn已成为重要的Python机器学习库, 简称sklearn, 支持包括 分类, 回归, 降维和聚类 等机器学习算法, 还包括了 特征提取, 数据处理, 模
阅读全文
摘要:手动实现KNN算法 计算距离 取k个邻近排序 距离(欧氏) 预习 实现欧式距离 KNN 计算输入样本点,到每个样本的距离 距离值向量 将距离值向量降序取前k个值 投票 预习 Counter类(计数器) Counter (计数器): 用于追踪值出现的次数 Counter 类继承dict类, 能顺颂di
阅读全文
摘要:认识 什么是KNN KNN 即 K nearest neighbors, 是一个hello world级别, 但被广泛使用的 机器学习算法 , 中文叫 K近邻算法 , 是一种基本的分类和回归方法. KNN既可用来分类, 也可用于回归, 不过我还是觉得分类好一些哦 KNN的核心思想是, 如果一个样本,
阅读全文