摘要: 一.八爪鱼抓取智联招聘信息 1.1 打开八爪鱼采集器==》选择快速开始==>新建任务(高级模式) 1.2点击下一步 基本流程如下点击下一步 1.3启动单机采集等待数据抓取完毕 1.4导出数据 csv格式 二.将信息导入到虚拟机 2.1 因访问外网需要建立socroueCRT映射 2.2使用Fz将数据 阅读全文
posted @ 2017-08-25 14:34 菜鸟的进击 阅读(4843) 评论(0) 推荐(0) 编辑
摘要: 一.Spark的产生背景起源 1.spark特点 1.1轻量级快速处理 Saprk允许传统的hadoop集群中的应用程序在内存中已100倍的速度运行即使在磁盘上也比传统的hadoop快10倍,Spark通过减少对磁盘的io达到性能上的提升,他将中间处理的数据放到内存中,spark使用了rdd(res 阅读全文
posted @ 2017-08-25 14:25 菜鸟的进击 阅读(9563) 评论(0) 推荐(0) 编辑