2019 年 12月 1 日随笔档案 - 不像话

2019年12月1日

摘要：首先准备工具环境：hadoop2.7+mysql5.7+sqoop1.4+hive3.1 准备一张数据库表：接下来就可以操作了。。。一、将MySQL数据导入到hdfs 首先我测试将zhaopin表中的前100条数据导出来，只要id、jobname、salarylevel三个字段。再Hdfs上创阅读全文

posted @ 2019-12-01 16:12 不像话阅读(6375) 评论(0) 推荐(1) 编辑

python-scrapy爬取某招聘网站信息(一)

摘要：首先准备python3+scrapy+mysql+pycharm。。。这次我们选择爬取智联招聘网站的企业招聘信息，首先我们有针对的查看网站的html源码，发现其使用的是js异步加载的方式，直接从服务端调取json数据，这就意味着我们用地址栏的网址获取的网站内容是不全的，无法获得想要的数据。那么我阅读全文

posted @ 2019-12-01 13:02 不像话阅读(2127) 评论(4) 推荐(0) 编辑

不像话

公告