大数据——添加行业代码

import pandas as pd

# 读取数据
df = pd.read_csv('new_result_05.csv')

# 行业分类与代码映射表
industry_mapping = {
    '农业': 'A01',
    '林业': 'A02',
    '畜牧业': 'A03',
    '采矿业': 'B',
    '农副食品加工业': 'C13',
    '化学原料及化学制品制造业': 'C27',
    '化学纤维制造业':'C28',
    '专用设备制造业':'C35',
    '电力、燃气及水的生产和供应业':'D',
    '建筑业':'E',
    '信息传输、计算机服务和软件业':'J',
    '自然科学研究与试验发展':'M73',
    '工程和技术研究与试验发展':'M74',
    '科技交流和推广服务业':'M75',
    '水利管理业':'N82',
    '环境管理业':'N83',
    '基础医学':'R81',
    '临床医学':'R82',
    '其他':'Z',
    '黑色金属冶炼及压延加工业':'C21',
    '医药制造业':'C21',
    '资源与环境':'E50',
    '先进制造与自动化':'C38',
    '材料与化工':'C27',
    '电子信息':'J72',
    '生物与医药':'C21',
    '现代农业':'A01',
    '社会公益':'S94',
    '航空与航天':'H48',
    '能源与交通':'D44',
    '交通运输设备制造业':'C37'
}

# 将所属技术领域映射为行业代码
df['应用行业代码'] = df['所属技术领域'].map(industry_mapping)

# 根据省市县进行统计
province_stats = df.groupby('省')['应用行业代码'].value_counts()
city_stats = df.groupby(['省', '市'])['应用行业代码'].value_counts()
county_stats = df.groupby(['省', '市', '县'])['应用行业代码'].value_counts()

# 数据下钻到县进行统计不同行业的数量
county_stats_unstacked = county_stats.unstack().fillna(0)
print(county_stats_unstacked)
# 将统计结果保存到 CSV 文件
county_stats_unstacked.to_csv('county_stats.csv', encoding='utf-8')
# 保存结果到新的CSV文件
df.to_csv('result_table06.csv', index=False)
posted @ 2024-03-26 21:00  会秃头的小白  阅读(26)  评论(0编辑  收藏  举报