随笔分类 - ⑦ 机器学习 5 - 算法分析案例
摘要:安装 能直接安装就再好不过 pip install xgboost 如果不能就下载之后本地安装 安装包下载地址 这里 想要啥包都有 数据集 pima-indians-diabetes.csv 文件 调查印度糖尿病人的一些数据, 最终的预测结果是是否患病 # 1. Number of times pr
阅读全文
摘要:工作原理 基于集成算法的多个树累加, 可以理解为是弱分类器的提升模型 公式表达 基本公式 目标函数 目标函数这里加入了损失函数计算 这里的公式是用的均方误差方式来计算 最优函数解 要对所有的样本的损失值的期望, 求解最小的程度作为最优解 集成算法表示 集成算法中对所有的树进行累加处理 公式流程分解
阅读全文
摘要:深度学习背景引入 和机器学习的关系对比 机器学习是很大的一个范围, 包好了深度学习在内的很多内容 卷积神经网络又是深度学习中的一个特化的子类 在数据量不大的程度下, 深度学习和传统的人工智能算法没有太大的区别 但是上限方面就要高得多, 而且数据规模越大差距越大 计算机视觉 深度学习和计算机视觉几乎是
阅读全文
摘要:聚类算法 概述 无监督问题 手中无标签 聚类 将相似的东西分到一组 难点 如何 评估, 如何 调参 基本概念 要得到的簇的个数 - 需要指定 K 值 质心 - 均值, 即向量各维度取平均 距离的度量 - 常用 欧几里得距离 和 余弦线相似度 ( 先标准化 ) 优化目标 - 需求每个簇中的点, 到质心
阅读全文
摘要:SVM 代码实现展示 相关模块引入 %matplotlib inline import numpy as np import matplotlib.pyplot as plt from scipy import stats import seaborn as sns;sns.set() # 使用se
阅读全文
摘要:SVM 原理引入 支持向量机( SVM,Support Vector Machine ) 背景 2012年前较为火热, 但是在12年后被神经网络逼宫, 由于应用场景以及应用算法的不同, SVM还是需要有所了解,而且在面试中SVM一般都会问到, 支持向量机是一个非常 经典且高效的分类模型 要解决的问题
阅读全文
摘要:文本分析概念 停用词 语料中大量出现, 无用数据, 如下类似的这种词语 Tf - 词频统计 TF 的计算方式有很多, 最常见的用 某词文章中出现次数 / 文章总词数 idf - 逆文档频率 TF - idf 关键词提取 相似度 分词 语料库 词频 词频向量 整体流程 语料清洗 (去掉停用词, 去掉大
阅读全文
摘要:贝叶斯公式原理概述 贝叶斯要解决的问题 正向概率 逆向概率 公式推导 - 男女裤子问题 概率 求解 即显示意义就是 欲求解 B 条件下 A 发生的概率, 可以转换成 用 A 条件下 B 发生的概率 和 A , B 各自发生的概率 进行计算 这样可以通过已知的条件组合为想要求解的概率 现实实例 - 拼
阅读全文
摘要:样本数据 PassengerId,Survived,Pclass,Name,Sex,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked 1,0,3,"Braund, Mr. Owen Harris",male,22,1,0,A/5 21171,7.25,,S 2,1
阅读全文
摘要:Ensemble learning - 集成算法 ▒ 目的 让机器学习的效果更好, 量变引起质变 继承算法是竞赛与论文的神器, 注重结果的时候较为适用 集成算法 - 分类 ▒ Bagging - bootstrap aggregation ◈ 公式 ◈ 原理 训练多个分类器取平均, 并行 的训练一堆
阅读全文
摘要:决策树 概述 ▒ 树模型 ▨ 从根节点一步一步走到叶子节点 ( 决策 ) ▨ 所有数据都会落在叶子节点, 既可以做分类也可以做回归 ▒ 树的组成 ▨ 根节点 - 第一个选择点 ▨ 非叶子节点与分支 - 中间过程 ▨ 叶子节点 - 最终的决策结果 ▒ 节点 ▨ 节点相当于在数据中进行切一刀 ( 切分两
阅读全文
摘要:案例背景 银行评判用户的信用考量规避信用卡诈骗 ▒ 数据 数据共有 31 个特征, 为了安全起见数据已经向了模糊化处理无法读出真实信息目标 其中数据中的 class 特征标识为是否正常用户 (0 代表正常, 1 代表异常) ▒ 目标 本质依旧是一个分类问题, 0/1 的问题判断是否为信用卡诈骗用户
阅读全文
摘要:梯度下降求解逻辑回归 - 算法实现 相关模块 - 三大件 #三大件 import numpy as np import pandas as pd import matplotlib.pyplot as plt %matplotlib inline 数据集 - 大学录取 我们将建立一个逻辑回归模型来预
阅读全文
摘要:线性回归算法 数学概念 ▒ 回归 - 回归会得到最终的计算结果, 是一个确定性的结果 ▒ 分类 - 分类会进行分析给于一个结果的判断类别, 也是一个确定的结果 简单实例 - 银行贷款 实例分析 ▒ 数据 - 工资和年龄 ( 2个特征 ) ▒ 目标 - 预测银行会给我贷款多少钱 ( 标签 ) ▒ 考虑
阅读全文