python | Pandas.unique()函数
unique()
是Pandas中的一个函数,用于获取Series或DataFrame中的唯一值,它返回一个包含Series或DataFrame中唯一值的数组,按照它们在原始数据中的出现顺序排列。
对于足够长的序列,比 numpy.unique 快得多。包括 NA 值。
data = {'Name': ['John', 'Tom', 'Alice', 'John'],
'Age': [20, 25, 30, 20],
'Gender': ['M', 'M', 'F', 'M']}
df = pd.DataFrame(data)
#获取某一列的唯一值,也可以直接选择这一列,并使用Series的unique()方法
unique_ages = df['Age'].unique()
print(unique_ages)
[20 25 30]
使用Pandas中的apply()
方法,将nunique()
方法应用于DataFrame中的每一列,返回的是唯一值的个数。
unique_values = df.apply(pd.Series.nunique)
print(unique_values)
Name 3
Age 3
Gender 2
dtype: int64
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
2023-02-28 Python 之 lambda 函数