2018年4月23日

爬取晨星网对各公司主要职位的分析

摘要: 一.程序运用了三个主要函数:获取url函数,获取网页文本信息函数,生成词云函数 1. 应对网站的反爬虫机制,添加了'User-Agent' 2. 运用Beautifulsoup函数对html进行分析,并将数据返回到主函数中,存在txt文本文件中,便于调用 3. 运用jieba对爬取的文本文件进行分词 阅读全文

posted @ 2018-04-23 11:04 133饶敏 阅读(943) 评论(0) 推荐(0) 编辑

导航