统计词语频率保存到xls
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 | import json import jieba.analyse as anl import xlwt # 获取待统计的文本内容 # 打开文件 f = open ( 'zhilian.json' , 'r' , encoding = 'utf-8' ) ans_data = '' for index in range ( 1867 ): data = f.readline().replace( '},' , '}' ) dict = json.loads(data) ans_data + = dict [ 'job_content' ] # 关闭文件 f.close() # xls的相关操作 # 新建文件,后面save workbook = xlwt.Workbook(encoding = 'ascii' ) # 新建sheet表 worksheet = workbook.add_sheet( 'python招聘分词' ) # jieba分词统计ans_data文本中,分词后的频率 seg = anl.extract_tags(ans_data, topK = 150 , withWeight = True ) index = 0 for tag, weight in seg: print ( "%-20s:%3s %-8s" % (weight, index, tag)) # 写入xls的单元格 worksheet.write(index, 0 , label = index + 1 ) worksheet.write(index, 1 , label = tag) worksheet.write(index, 2 , label = weight) index + = 1 # 保存xls文件 workbook.save( 'python招聘分词统计.xls' ) |
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步