2018 年 4月 23 日随笔档案 - 133饶敏

2018年4月23日

爬取晨星网对各公司主要职位的分析

摘要：一.程序运用了三个主要函数：获取url函数，获取网页文本信息函数，生成词云函数 1. 应对网站的反爬虫机制，添加了'User-Agent' 2. 运用Beautifulsoup函数对html进行分析，并将数据返回到主函数中，存在txt文本文件中，便于调用 3. 运用jieba对爬取的文本文件进行分词阅读全文

posted @ 2018-04-23 11:04 133饶敏阅读(943) 评论(0) 推荐(0) 编辑

133饶敏

爬取晨星网对各公司主要职位的分析

导航

公告