小小喽啰 - 博客园

2020年12月3日

摘要：用于多个图形画在同一画框中，以区分哪个图形属于哪个 import matplotlib.pyplot as plt import numpy as np x = np.linspace(0, 2 * np.pi, 50) y = np.sin(x) plt.plot(x, y) plt.plot(x 阅读全文

posted @ 2020-12-03 20:46 小小喽啰阅读(878) 评论(0) 推荐(0)

画堆积柱形图

摘要：一、plt画堆积柱形图只需要这个一个参数（bottom=y）就OK了 import matplotlib.pyplot as plt import matplotlib as mpl mpl.rcParams["font.sans-serif"] = ["SimHei"] mpl.rcParams 阅读全文

posted @ 2020-12-03 19:26 小小喽啰阅读(1954) 评论(0) 推荐(0)

用于聚类的信用卡数据

摘要：本数据主要用于看看kmean是如何实现，以及kmeans怎么寻找最优k值数据来源https://www.kaggle.com/arjunbhasin2013/ccdata 样本数据集在过去6个月中总结了9000（8950 rows × 18 columns）活跃的信用卡持有人的使用行为。该文件处于阅读全文

posted @ 2020-12-03 16:18 小小喽啰阅读(1204) 评论(0) 推荐(0)

2020年12月2日

numpy 的布尔值切片

摘要：我们做模型时，可能需要画不同类别的标记不同颜色的值，因此就需要的numpy的布尔值索引，比如说： # 导入可视化工具包 import matplotlib.pyplot as plt %matplotlib inline from sklearn.datasets import load_iris 阅读全文

posted @ 2020-12-02 11:45 小小喽啰阅读(407) 评论(0) 推荐(0)

sklearn.manifold.TSNE可视化高位数据工具

摘要： manifold learning流形学习多维度数据集非常难于可视化。反而2维或者3维数据很容易通过图表展示数据本身的内部结构，等价的高维绘图就远没有那么直观了。为了实现数据集结构的可视化，数据的维度必须通过某种方式降维。最简单的降维手段是数据的随机投影。虽然这种方式实现一定程度的数据结构可视化阅读全文

posted @ 2020-12-02 10:20 小小喽啰阅读(3479) 评论(0) 推荐(0)

2020年12月1日

kmeans原理

摘要：一、kmeans概述 K-means聚类算法也称k均值聚类算法，属于无监督学习的一种，k-means聚类无需给定Y变量，只有特征X。 K-means聚类算法是一种迭代求解的聚类分析算法，其步骤是随机选取K个对象作为初始的聚类中心，然后计算每个对象与各个种子聚类中心之间的距离，把每个对象分配给距离它最阅读全文

posted @ 2020-12-01 19:14 小小喽啰阅读(2921) 评论(0) 推荐(0)

2020年11月30日

如何将list嵌套的list的[]去掉

摘要：比如说 a = [[1,2,3], [5, 2, 8], [7,8,9]] 我们需要将里面的[]去掉，但是又不删除任意元素如果list里里面的元素是数字，‘1’也是可以的，那么我们可以使用np.ravel a = [[1,2,3], [5, 2, 8], [7,8,9]] list(np.rave 阅读全文

posted @ 2020-11-30 20:55 小小喽啰阅读(2859) 评论(0) 推荐(1)

pandas 根据两个初始时间差生成对应行数

摘要：比如说，初始日期分别是20200101，20201201，我要生成如下代码如下： list1=[] #用于储存id list2=[] #用于储存date for i in range(len(tmp)): #生成时间序列 obs_list = [str(i.date()) for i in (pd 阅读全文

posted @ 2020-11-30 20:31 小小喽啰阅读(264) 评论(0) 推荐(0)

KL散度、JS散度和交叉熵

摘要： KL散度、JS散度和交叉熵三者都是用来衡量两个概率分布之间的差异性的指标 1. KL散度 KL散度又称为相对熵，信息散度，信息增益。KL散度是是两个概率分布 P 和 Q (概率分布P(x)和Q(x)) 之间差别的非对称性的度量。 KL散度是用来度量使用基于 Q 的编码来编码来自 P 的样本平均所需阅读全文

posted @ 2020-11-30 17:50 小小喽啰阅读(1573) 评论(0) 推荐(0)

2020年11月28日

np.dot()计算两个变量的乘积

摘要： np.dot()计算两个变量的乘积，返回的是一个值 import numpy as np np.dot(a, b, out=None) #该函数的作用是获取两个元素a,b的乘积. a,b可以是数组或者int print(np.dot(1,10)) #10 还可以 import numpy as np 阅读全文

posted @ 2020-11-28 15:53 小小喽啰阅读(450) 评论(0) 推荐(0)