python | Pandas.unique()函数

unique()是Pandas中的一个函数，用于获取Series或DataFrame中的唯一值，它返回一个包含Series或DataFrame中唯一值的数组，按照它们在原始数据中的出现顺序排列。

对于足够长的序列，比 numpy.unique 快得多。包括 NA 值。

data = {'Name': ['John', 'Tom', 'Alice', 'John'],
        'Age': [20, 25, 30, 20],
        'Gender': ['M', 'M', 'F', 'M']}
df = pd.DataFrame(data)
#获取某一列的唯一值，也可以直接选择这一列，并使用Series的unique()方法
unique_ages = df['Age'].unique()
print(unique_ages)

[20 25 30]

使用Pandas中的apply()方法，将nunique()方法应用于DataFrame中的每一列，返回的是唯一值的个数。

unique_values = df.apply(pd.Series.nunique)
print(unique_values)

Name      3
Age       3
Gender    2
dtype: int64

posted @ 2024-02-28 20:41 华小电阅读(2314) 评论(0) 收藏举报

刷新页面返回顶部