python | Pandas.unique()函数

unique()是Pandas中的一个函数,用于获取Series或DataFrame中的唯一值,它返回一个包含Series或DataFrame中唯一值的数组,按照它们在原始数据中的出现顺序排列。

对于足够长的序列,比 numpy.unique 快得多。包括 NA 值。

data = {'Name': ['John', 'Tom', 'Alice', 'John'],
        'Age': [20, 25, 30, 20],
        'Gender': ['M', 'M', 'F', 'M']}
df = pd.DataFrame(data)
#获取某一列的唯一值,也可以直接选择这一列,并使用Series的unique()方法
unique_ages = df['Age'].unique()
print(unique_ages)
[20 25 30]

使用Pandas中的apply()方法,将nunique()方法应用于DataFrame中的每一列,返回的是唯一值的个数。

unique_values = df.apply(pd.Series.nunique)
print(unique_values)
Name      3
Age       3
Gender    2
dtype: int64
posted @ 2024-02-28 20:41  华小电  阅读(1375)  评论(0编辑  收藏  举报