摘要: 项目需求 自定义输入格式,将明星微博数据排序后按粉丝数 关注数 微博数 分别输出到不同文件中。 数据集 下面是部分数据,猛戳此链接下载完整数据集 数据格式: 明星 明星微博名称 粉丝数 关注数 微博数 黄晓明 黄晓明 22616497 506 2011 张靓颖 张靓颖 27878708 238 38 阅读全文
posted @ 2018-04-14 21:30 子墨言良 阅读(3198) 评论(0) 推荐(1) 编辑
摘要: 今天跑Hadoop程序时一直提示我无法加载本地库,然后就直接退出运行了,如下图所示。 原因是由于Apache提供的Hadoop本地库是32位的,而在64位的服务器上就会有问题,因此需要自己编译64位的版本。下载地址:http://dl.bintray.com/sequenceiq/sequencei 阅读全文
posted @ 2018-04-14 20:32 子墨言良 阅读(2426) 评论(0) 推荐(0) 编辑