摘要: 今天运行了一段程序:分析专利引用数据集,从专利引用数据集中计算专利被引用的次数在专利局http://data.nber.org/patents/网站下载专利数据作为测试数据,是个251MB的.txt文件...具体原因至今不详,可能是因为我的运行环境是建立在虚拟机之上?在一次运行非正常退出后,输入命令... 阅读全文
posted @ 2015-03-11 19:58 tinylcy 阅读(3130) 评论(0) 推荐(0) 编辑
摘要: 原来我要实现的是最基本的将本地文件拷贝到HDFS上去,所以写了下面的程序:package com.lcy.hadoop.file;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.FileSystem;im... 阅读全文
posted @ 2015-03-11 14:43 tinylcy 阅读(1982) 评论(0) 推荐(0) 编辑