python语言---------------------------------------新冠数据分析(pandas模块)
准备数据
读取表头:
上代码:
# 导入数据处理包
import pandas as pd
# 读取Excel,header=1表示取第二行数据作为列名(表头)
data_set = pd.read_excel('/Users/Administrator/Desktop/test.xlsx',header=1)
# 查看数据规模
data_set.shape
# 输出:(200, 5)
# 查看表头
data_set.columns
# 输入:Index(['时间', '新增', '总确诊', '治愈', '死亡'], dtype='object')
print(data_set.shape)
print(data_set.columns)
实现效果如下:
MID函数
# 导入数据处理包
import pandas as pd
# 读取Excel,header=1表示取第二行数据作为列名(表头)
data_set = pd.read_excel('/Users/Administrator/Desktop/test.xlsx',header=1)
'''
MID
根据时间一列新增一列:月
Excel实现:MID(A3,6,1)
'''
data_set['月'] = [i[5:6] for i in data_set['时间']]
data_set.head(3)
print(data_set.head(3))
实现效果如下: