import pandas as pd
# 读取数据
df = pd.read_csv('new_result_05.csv')
# 行业分类与代码映射表
industry_mapping = {
'农业': 'A01',
'林业': 'A02',
'畜牧业': 'A03',
'采矿业': 'B',
'农副食品加工业': 'C13',
'化学原料及化学制品制造业': 'C27',
'化学纤维制造业':'C28',
'专用设备制造业':'C35',
'电力、燃气及水的生产和供应业':'D',
'建筑业':'E',
'信息传输、计算机服务和软件业':'J',
'自然科学研究与试验发展':'M73',
'工程和技术研究与试验发展':'M74',
'科技交流和推广服务业':'M75',
'水利管理业':'N82',
'环境管理业':'N83',
'基础医学':'R81',
'临床医学':'R82',
'其他':'Z',
'黑色金属冶炼及压延加工业':'C21',
'医药制造业':'C21',
'资源与环境':'E50',
'先进制造与自动化':'C38',
'材料与化工':'C27',
'电子信息':'J72',
'生物与医药':'C21',
'现代农业':'A01',
'社会公益':'S94',
'航空与航天':'H48',
'能源与交通':'D44',
'交通运输设备制造业':'C37'
}
# 将所属技术领域映射为行业代码
df['应用行业代码'] = df['所属技术领域'].map(industry_mapping)
# 根据省市县进行统计
province_stats = df.groupby('省')['应用行业代码'].value_counts()
city_stats = df.groupby(['省', '市'])['应用行业代码'].value_counts()
county_stats = df.groupby(['省', '市', '县'])['应用行业代码'].value_counts()
# 数据下钻到县进行统计不同行业的数量
county_stats_unstacked = county_stats.unstack().fillna(0)
print(county_stats_unstacked)
# 将统计结果保存到 CSV 文件
county_stats_unstacked.to_csv('county_stats.csv', encoding='utf-8')
# 保存结果到新的CSV文件
df.to_csv('result_table06.csv', index=False)