python | Pandas.unique()函数
unique()
是Pandas中的一个函数,用于获取Series或DataFrame中的唯一值,它返回一个包含Series或DataFrame中唯一值的数组,按照它们在原始数据中的出现顺序排列。
对于足够长的序列,比 numpy.unique 快得多。包括 NA 值。
data = {'Name': ['John', 'Tom', 'Alice', 'John'],
'Age': [20, 25, 30, 20],
'Gender': ['M', 'M', 'F', 'M']}
df = pd.DataFrame(data)
#获取某一列的唯一值,也可以直接选择这一列,并使用Series的unique()方法
unique_ages = df['Age'].unique()
print(unique_ages)
[20 25 30]
使用Pandas中的apply()
方法,将nunique()
方法应用于DataFrame中的每一列,返回的是唯一值的个数。
unique_values = df.apply(pd.Series.nunique)
print(unique_values)
Name 3
Age 3
Gender 2
dtype: int64