#设置某列为行索引 import pandas as pd df=pd.read_excel('msb课程记录.xls') #print(df) df=df.set_index (['买家会员名']) print(df)
买家实际支付金额 课程总数量 课程标题 类别 \ 买家会员名 msb001 30960.00 2.0 java互联网高级框架师 课程 msb002 1.00 1.0 金三银四面试突击班 NaN msb003 9980.00 1.0 GoLang从入门到精通 课程 msb004 9980.00 NaN 算法与数据结构进阶班 课程 msb005 9.90 1.0 大前端VIP体验营 NaN msb006 0.02 1.0 零基础速成班HTML+CSS 课程 msb007 2400.00 1.0 操作系统 课程 msb008 1.00 NaN 自定义注释 课程 msb009 2980.00 1.0 多线程与高并发 课程 msb010 1980.00 1.0 科技英语 课程 msb010 1980.00 1.0 科技英语 课程 订单付款时间 买家会员名 msb001 2022-10-09 msb002 2022-10-09 msb003 2022-01-19 msb004 2022-06-30 msb005 2022-03-23 msb006 2022-03-24 msb007 2022-03-25 msb008 2022-03-26 msb009 2022-03-27 msb010 2022-03-28 msb010 2022-03-28
#数据清洗后,重新设置连续的索引
#数据清洗后,重新设置连续的索引 import pandas as pd df=pd.read_excel('msb课程记录.xls') print(df) df=df.dropna().reset_index(drop=True) print(df)
买家会员名 买家实际支付金额 课程总数量 课程标题 类别 \ 0 msb001 30960.00 2.0 java互联网高级框架师 课程 1 msb002 1.00 1.0 金三银四面试突击班 NaN 2 msb003 9980.00 1.0 GoLang从入门到精通 课程 3 msb004 9980.00 NaN 算法与数据结构进阶班 课程 4 msb005 9.90 1.0 大前端VIP体验营 NaN 5 msb006 0.02 1.0 零基础速成班HTML+CSS 课程 6 msb007 2400.00 1.0 操作系统 课程 7 msb008 1.00 NaN 自定义注释 课程 8 msb009 2980.00 1.0 多线程与高并发 课程 9 msb010 1980.00 1.0 科技英语 课程 10 msb010 1980.00 1.0 科技英语 课程 订单付款时间 0 2022-10-09 1 2022-10-09 2 2022-01-19 3 2022-06-30 4 2022-03-23 5 2022-03-24 6 2022-03-25 7 2022-03-26 8 2022-03-27 9 2022-03-28 10 2022-03-28 买家会员名 买家实际支付金额 课程总数量 课程标题 类别 \ 0 msb001 30960.00 2.0 java互联网高级框架师 课程 1 msb003 9980.00 1.0 GoLang从入门到精通 课程 2 msb006 0.02 1.0 零基础速成班HTML+CSS 课程 3 msb007 2400.00 1.0 操作系统 课程 4 msb009 2980.00 1.0 多线程与高并发 课程 5 msb010 1980.00 1.0 科技英语 课程 6 msb010 1980.00 1.0 科技英语 课程 订单付款时间 0 2022-10-09 1 2022-01-19 2 2022-03-24 3 2022-03-25 4 2022-03-27 5 2022-03-28 6 2022-03-28