上一页 1 2 3 4 5 6 7 ··· 14 下一页
摘要: pass 阅读全文
posted @ 2019-03-15 08:37 萌萌的美男子 阅读(118) 评论(0) 推荐(0) 编辑
摘要: pass 阅读全文
posted @ 2019-03-15 08:36 萌萌的美男子 阅读(174) 评论(0) 推荐(0) 编辑
摘要: pass 阅读全文
posted @ 2019-03-15 08:35 萌萌的美男子 阅读(105) 评论(0) 推荐(0) 编辑
摘要: pass 阅读全文
posted @ 2019-03-15 08:34 萌萌的美男子 阅读(132) 评论(0) 推荐(0) 编辑
摘要: 一、传统机器学习算法 回归预测 Logistic回归 关联规则之Apriori AdaBoost PageRank k近邻 KNN 聚类之k-means 支持向量机SVM、优化问题、核函数 决策树:ID3、C4.5、CART 朴素贝叶斯 最大期望算法 EM 马尔可夫决策 TF-IDF 阅读全文
posted @ 2019-03-14 16:03 萌萌的美男子 阅读(212) 评论(0) 推荐(0) 编辑
摘要: 1、创建字符串 使用一对单引号或一对双引号。使用两种引号的目的是可以创建本身就包含引号的字符串而不需要转义符。 使用'''....'''或“”“...”“”,多用于创建多行字符串,每行的换行符、行首行末的空格都会被保留 使用str()将其他数据类型转为字符串 注意:print()输出字符串时会把包裹 阅读全文
posted @ 2019-03-13 00:32 萌萌的美男子 阅读(142) 评论(0) 推荐(0) 编辑
摘要: 1、数据质量分析 脏数据:缺失值、异常值、不一致的值、重复数据及含有特殊符号的数据 缺失值处理 产生原因 1、信息无法获取或者获取代价大 2、信息因个人原因或客观原因被遗漏 3、根据实际而言,属性值不存在 影响 1、丢失大量有用信息 2、不确定性更加显著,难以把握规律 3、不可靠输出 分析 1、含有 阅读全文
posted @ 2019-03-12 20:06 萌萌的美男子 阅读(488) 评论(0) 推荐(0) 编辑
摘要: 1、基础 适用数据:数值型。 (1)相关系数(R2)衡量 有时候,我们需要计算预测值与实际值的匹配程度,来衡量所建立模型的好坏。此时,需要计算Y、Y‘的相关系数: 其中,Cov表示协方差,Var表示方差。 (2)缩减系数 当数据的特征比样本数目还多时,此时n>m,输入的样本矩阵非满秩矩阵,在求逆时会 阅读全文
posted @ 2019-03-12 19:55 萌萌的美男子 阅读(1365) 评论(0) 推荐(0) 编辑
摘要: 聚类,就是根据数据的“相似性”将数据分为多类的过程。 评估不同样本之间的“相似性”,通常使用的方法为计算样本之间的“距离”。距离计算方法的不同会影响聚类结果的好坏。 1)簇类型 (1)明显分离的簇 簇是对象的集合。 每个点到同簇中任意点的距离比到不同簇中所有点的距离更近。簇的形状任意。 (2)基于中 阅读全文
posted @ 2019-03-12 19:28 萌萌的美男子 阅读(1175) 评论(0) 推荐(0) 编辑
摘要: 1、混淆矩阵 一般情况下,分类器的好坏是通过错误率来衡量的。错误率指的是在测试数据中错误分类的样本所占比例。然而,这样进行度量掩盖了样例如何被分错的原因。 三类问题混淆矩阵示例: 当该矩阵中非对角元素均为0,那么就会得到完美的分类器。 二分类混淆矩阵: 在分类中,当某个类别的重要性高于其他类别时,可 阅读全文
posted @ 2019-03-12 19:24 萌萌的美男子 阅读(674) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 ··· 14 下一页