开课吧--Python数据分析--第5节 数联璧合--互动练习:最长的时间是多久?
题目要求
现在我们有2017年度1月份和2月份的共享单车历史骑行数据,路径为./data2017_1_data.csv和./data/2017_2_data.csv。
题目讲解
将两个csv数据合并成一个数据,并按骑行时间进行倒序排列,获取最长的骑行时间。
参数据描述
- Duration (ms):骑行时间, 以毫秒为单位
- Start date:开始骑行时间
- End date:结束骑行时间
- Start station:开始地点
- Start date:开始骑行时间
- End station:结束地点
- Bike number:共享单车车号
- Member type:用户类别: 会员(Member/casual非会员)
书写代码
import pandas as pd
df1 = pd.read_csv('./data/2017_1_data.csv')
df2 = pd.read_csv('./data/2017_2_data.csv')
# 将两个csv数据合并成一个数据
df = pd.concat([df1,df2],axis=0,join='outer',ignore_index=True)
# 按骑行时间进行倒序排列
df.sort_values(by='Duration (ms)',ascending=False,inplace=True)
df.iloc[0]['Duration (ms)'] # df['Duration (ms)'].values[0]