TOP
上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 33 下一页
摘要: PCA 主成分分析 原理概述 用途 - 降维中最常用的手段 目标 - 提取最有价值的信息( 基于方差 ) 问题 - 降维后的数据的意义 ? 所需数学基础概念 向量的表示 基变换 协方差矩阵 协方差 优化目标 降维实例 代码实现 """ 这里假设原始数据集为矩阵 dataMat,其中每一行代表一个样本 阅读全文
posted @ 2019-11-25 17:14 羊驼之歌 阅读(451) 评论(0) 推荐(0)
摘要: 聚类算法 概述 无监督问题 手中无标签 聚类 将相似的东西分到一组 难点 如何 评估, 如何 调参 基本概念 要得到的簇的个数 - 需要指定 K 值 质心 - 均值, 即向量各维度取平均 距离的度量 - 常用 欧几里得距离 和 余弦线相似度 ( 先标准化 ) 优化目标 - 需求每个簇中的点, 到质心 阅读全文
posted @ 2019-11-25 09:01 羊驼之歌 阅读(915) 评论(0) 推荐(0)
摘要: SVM 代码实现展示 相关模块引入 %matplotlib inline import numpy as np import matplotlib.pyplot as plt from scipy import stats import seaborn as sns;sns.set() # 使用se 阅读全文
posted @ 2019-11-22 11:17 羊驼之歌 阅读(916) 评论(0) 推荐(0)
摘要: SVM 原理引入 支持向量机( SVM,Support Vector Machine ) 背景 2012年前较为火热, 但是在12年后被神经网络逼宫, 由于应用场景以及应用算法的不同, SVM还是需要有所了解,而且在面试中SVM一般都会问到, 支持向量机是一个非常 经典且高效的分类模型 要解决的问题 阅读全文
posted @ 2019-11-21 16:00 羊驼之歌 阅读(531) 评论(0) 推荐(0)
摘要: 文本分析概念 停用词 语料中大量出现, 无用数据, 如下类似的这种词语 Tf - 词频统计 TF 的计算方式有很多, 最常见的用 某词文章中出现次数 / 文章总词数 idf - 逆文档频率 TF - idf 关键词提取 相似度 分词 语料库 词频 词频向量 整体流程 语料清洗 (去掉停用词, 去掉大 阅读全文
posted @ 2019-11-18 16:40 羊驼之歌 阅读(2496) 评论(0) 推荐(0)
摘要: 贝叶斯公式原理概述 贝叶斯要解决的问题 正向概率 逆向概率 公式推导 - 男女裤子问题 概率 求解 即显示意义就是 欲求解 B 条件下 A 发生的概率, 可以转换成 用 A 条件下 B 发生的概率 和 A , B 各自发生的概率 进行计算 这样可以通过已知的条件组合为想要求解的概率 现实实例 - 拼 阅读全文
posted @ 2019-11-07 17:55 羊驼之歌 阅读(431) 评论(0) 推荐(0)
摘要: 样本数据 PassengerId,Survived,Pclass,Name,Sex,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked 1,0,3,"Braund, Mr. Owen Harris",male,22,1,0,A/5 21171,7.25,,S 2,1 阅读全文
posted @ 2019-11-06 18:07 羊驼之歌 阅读(624) 评论(0) 推荐(0)
摘要: 数据类型 数据数据一般是可以直接加载运算的数据, 一般是整形浮点型等 分类数据则为文本数据, 比如男女, 雌雄等 分类数据描述统计 数值数据描述统计 平均数, 中位数, 众数 平均数 - 求和均分 - 较为适合再数据平稳的样本中 中位数 - 最中间的数值 - 目的查看最中间的数据 众数 - 最多的数 阅读全文
posted @ 2019-10-24 17:37 羊驼之歌 阅读(694) 评论(0) 推荐(0)
摘要: 链接数据库 点击确定后选择数据库, 然后输入用户名密码, 选择级别选择指定的数据库即可 之后弹出的导航器中即可有可预览的数据 更加推荐使用 再链接数据库的时候高级查询的 sql 中进行 sql 的执行操作, 这样也可以直接加载数据 异常 如果报错这个就点击链接下载之后重启 BI 即可 阅读全文
posted @ 2019-10-24 15:55 羊驼之歌 阅读(1313) 评论(0) 推荐(0)
摘要: 数据库 userinfo , orderinfo 表 两个 userId 彼此对应 题目 解题 不同月份的下单人数 用户在同一个月份会下多个单,这里进行去重 未支付的脏数据去除 统计用户三月份的回购率和复购率 复购率 - 一个月内重复购买的人数占比 先将所有 3月份购买超过一次的进行统计,然后在和全 阅读全文
posted @ 2019-10-24 15:37 羊驼之歌 阅读(832) 评论(0) 推荐(0)
上一页 1 ··· 4 5 6 7 8 9 10 11 12 ··· 33 下一页