plt.scatter() 和sns.scatterplot() 画散点图
plt.scatter()画散点图
matplotlib.pyplot.scatter(x, y, s=None, c=None, marker=None, cmap=None, norm=None, vmin=None, vmax=None, alpha=None, linewidths=None, verts=None, edgecolors=None, *, data=None, **kwargs)
参数解释:
1 x,y:表示的是大小为(n,)的数组,也就是我们即将绘制散点图的数据点,相当于是x、y轴坐标 2 s:是一个实数或者是一个数组大小为(n,),这个是一个可选的参数。可理解为散点的的点的大小 3 c:表示的是颜色,也是一个可选项。默认是蓝色'b',表示的是标记的颜色,或者可以是一个表示颜色的字符,或者是一个长度为n的表示颜色的序列等等,感觉还没用到过现在不解释了。但是c不可以是一个单独的RGB数字,也不可以是一个RGBA的序列。可以是他们的2维数组(只有一行)。 4 marker:表示的是标记的样式,默认的是'o'。 5 cmap:Colormap实体或者是一个colormap的名字,cmap仅仅当c是一个浮点数数组的时候才使用。如果没有申明就是image.cmap 6 norm:Normalize实体来将数据亮度转化到0-1之间,也是只有c是一个浮点数的数组的时候才使用。如果没有申明,就是默认为colors.Normalize。 7 vmin,vmax:实数,当norm存在的时候忽略。用来进行亮度数据的归一化。 8 alpha:实数,0-1之间。 9 linewidths:也就是标记点的长度。
例子:
## 基础函数库 import numpy as np ## 导入画图库 import matplotlib.pyplot as plt import seaborn as sns x_fearures = np.array([[-1, -2], [-2, -1], [-3, -2], [1, 3], [2, 1], [3, 2]]) y_label = np.array([0, 0, 0, 1, 1, 1]) ## 可视化构造的数据样本点 plt.figure() plt.scatter(x_fearures[:,0],x_fearures[:,1], c=y_label, s=50, cmap='viridis') plt.title('Dataset') plt.show()
#改变s的参数,点的大小改变了 plt.figure() plt.scatter(x_fearures[:,0],x_fearures[:,1], c=y_label, s=100, cmap='viridis') plt.title('Dataset') plt.show()
#改变market plt.figure() plt.scatter(x_fearures[:,0],x_fearures[:,1], c=y_label, s=100, cmap='viridis',marker='x') plt.title('Dataset') plt.show()
sns.scatterplot() 画散点图
seaborn.scatterplot(x=None, y=None, hue=None, style=None, size=None, data=None, palette=None, hue_order=None, hue_norm=None, sizes=None, size_order=None, size_norm=None, markers=True, style_order=None, x_bins=None, y_bins=None, units=None, estimator=None, ci=95, n_boot=1000, alpha='auto', x_jitter=None, y_jitter=None, legend='brief', ax=None, **kwargs)
参数解释:
1 data: DataFrame 2 x,y为数据中变量的名称; 作用:对将生成具有不同颜色的元素的变量进行分组。可以是分类或数字. 3 size:数据中的名称 作用:根据指定的名称(列名),根据该列中的数据值的大小生成具有不同大小的效果。可以是分类或数字。 4 style:数据中变量名称(比如:二维数据中的列名) 作用:对将生成具有不同破折号、或其他标记的变量进行分组。 5 palette:调试板名称,列表或字典类型 作用:设置hue指定的变量的不同级别颜色。 6 hue_order:列表(list)类型 作用:指定hue变量出现的指定顺序,否则他们是根据数据确定的。 7 hue_norm:tuple或Normalize对象 8 sizes:list dict或tuple类型 作用:设置线宽度,当其为数字时,它也可以是一个元组,指定要使用的最大和最小值,会自动在该范围内对其他值进行规范化。
例子
## 导入画图库 import matplotlib.pyplot as plt import seaborn as sns; sns.set() tips = sns.load_dataset("tips")
#如果单纯是data一个参数,这data的特征需要全部都是数值型 sns.scatterplot(data=tips) #ValueError: A wide-form input must have only numeric values. sns.scatterplot( x="total_bill", y="tip",data=tips) plt.show()
设置hue 根据设置的类别,产生颜色不同的点的散点图 eg.下图为根据time分类的散点图
sns.scatterplot(x="total_bill", y="tip", hue="time",data=tips) plt.show()
设置hue 根据设置的类别,产生颜色不同的点的散点图,设置style,使其生成不同的标记的点 eg.下图为hue与style设置相同的分类的散点图
sns.scatterplot(x="total_bill", y="tip",hue="time", style="time", data=tips) plt.show()
设置size ,根据设置的类别,产生大小不同的点的散点图
sns.scatterplot(x="total_bill", y="tip", size="time",data=tips) plt.show()
使用指定的标记
markers = {"Lunch": "s", "Dinner": "X"} sns.scatterplot(x="total_bill", y="tip", style="time", markers=markers, data=tips) plt.show()
利用pandas构建时间序列数据,从2000-1-31开始,以月为频率,生成100条时间序列
index = pd.date_range("2000-1-11", periods=100, freq="m", name="date") data = np.random.randn(100, 4).cumsum(axis=0) wide_df = pd.DataFrame(data, index, ["a", "b", "c", "d"]) sns.scatterplot(data=wide_df) plt.show()