上一页 1 ··· 11 12 13 14 15 16 17 18 19 ··· 39 下一页
  2020年12月3日
摘要: 本数据主要用于看看kmean是如何实现,以及kmeans怎么寻找最优k值 数据来源https://www.kaggle.com/arjunbhasin2013/ccdata 样本数据集在过去6个月中总结了9000(8950 rows × 18 columns)活跃的信用卡持有人的使用行为。该文件处于 阅读全文
posted @ 2020-12-03 16:18 小小喽啰 阅读(997) 评论(0) 推荐(0) 编辑
  2020年12月2日
摘要: 我们做模型时,可能需要画不同类别的标记不同颜色的值,因此就需要的numpy的布尔值索引,比如说: # 导入可视化工具包 import matplotlib.pyplot as plt %matplotlib inline from sklearn.datasets import load_iris 阅读全文
posted @ 2020-12-02 11:45 小小喽啰 阅读(361) 评论(0) 推荐(0) 编辑
摘要: manifold learning流形学习 多维度数据集非常难于可视化。反而2维或者3维数据很容易通过图表展示数据本身的内部结构,等价的高维绘图就远没有那么直观了。为了实现数据集结构的可视化,数据的维度必须通过某种方式降维。 最简单的降维手段是数据的随机投影。虽然这种方式实现一定程度的数据结构可视化 阅读全文
posted @ 2020-12-02 10:20 小小喽啰 阅读(3265) 评论(0) 推荐(0) 编辑
  2020年12月1日
摘要: 一、kmeans概述 K-means聚类算法也称k均值聚类算法,属于无监督学习的一种,k-means聚类无需给定Y变量,只有特征X。 K-means聚类算法是一种迭代求解的聚类分析算法,其步骤是随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最 阅读全文
posted @ 2020-12-01 19:14 小小喽啰 阅读(2242) 评论(0) 推荐(0) 编辑
  2020年11月30日
摘要: 比如说 a = [[1,2,3], [5, 2, 8], [7,8,9]] 我们需要将里面的[]去掉,但是又不删除任意元素 如果list里里面的元素是数字,‘1’也是可以的,那么我们可以使用np.ravel a = [[1,2,3], [5, 2, 8], [7,8,9]] list(np.rave 阅读全文
posted @ 2020-11-30 20:55 小小喽啰 阅读(2775) 评论(0) 推荐(1) 编辑
摘要: 比如说,初始日期分别是20200101,20201201,我要生成如下 代码如下: list1=[] #用于储存id list2=[] #用于储存date for i in range(len(tmp)): #生成时间序列 obs_list = [str(i.date()) for i in (pd 阅读全文
posted @ 2020-11-30 20:31 小小喽啰 阅读(208) 评论(0) 推荐(0) 编辑
摘要: KL散度、JS散度和交叉熵三者都是用来衡量两个概率分布之间的差异性的指标 1. KL散度 KL散度又称为相对熵,信息散度,信息增益。KL散度是是两个概率分布 P 和 Q (概率分布P(x)和Q(x)) 之间差别的非对称性的度量。 KL散度是用来 度量使用基于 Q 的编码来编码来自 P 的样本平均所需 阅读全文
posted @ 2020-11-30 17:50 小小喽啰 阅读(1337) 评论(0) 推荐(0) 编辑
  2020年11月28日
摘要: np.dot()计算两个变量的乘积,返回的是一个值 import numpy as np np.dot(a, b, out=None) #该函数的作用是获取两个元素a,b的乘积. a,b可以是数组或者int print(np.dot(1,10)) #10 还可以 import numpy as np 阅读全文
posted @ 2020-11-28 15:53 小小喽啰 阅读(361) 评论(0) 推荐(0) 编辑
摘要: 目录 最小值/最大值 极差(也就是最大值和最小值的差) 分位数 中位数 均值 加权平均值 方差 标准差 协方差矩阵 相关系数 直方图 1.numpy.amin() 计算最小值 numpy.amin(a[, axis=None, out=None, keepdims=np._NoValue, init 阅读全文
posted @ 2020-11-28 14:49 小小喽啰 阅读(255) 评论(0) 推荐(0) 编辑
  2020年11月27日
摘要: 先看看一个例子 #类别变量的每个类别频数可视化 def count_plot(x, **kwargs): sns.countplot(x=x) x=plt.xticks(rotation=90) f = pd.melt(train, value_vars=['Sex','Embarked']) g 阅读全文
posted @ 2020-11-27 17:26 小小喽啰 阅读(4577) 评论(0) 推荐(0) 编辑
上一页 1 ··· 11 12 13 14 15 16 17 18 19 ··· 39 下一页