摘要:
1 public static void main(String[] args) { 2 callMe1(new String[] { "a", "b", "c" ,"d"}); 3 callMe2("a", "b", "c" ,"d"); 4 ... 阅读全文
摘要:
1. Storm是什么,怎么做,如何做的更好?Storm是一个开源的分布式实时计算系统,它可以简单、可靠地处理大量的数据流。Storm有很多应用场景,如实时分析、在线机器学习、持续计算、分布式RPC、ETL,等等。Storm支持水平扩展,具有高容错性,保证每个消息都会得到处理,而且处理速度很快(在一... 阅读全文
摘要:
单机版使用的是FileSystem类的静态函数:FileSystem hdfs = FileSystem.get(conf) 伪分布式下需要使用Path来获得Path path = new Path("hdfs://mlj:9000/dir"); FileSystem hdfs = path.ge... 阅读全文
摘要:
package MRNB_V4;import java.io.IOException;import java.util.Iterator;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.conf.Configu... 阅读全文
摘要:
对比:hadoop版本1.x 新版,hadoop版本0.x 旧版1.新api引用包一般是mapreduce,旧版api引用的包一般是mapred2.新api使用Job,旧版api使用JobConf3.新api类的包名使用mapreduce,旧版api使用mapred4.新api使用job.waitF... 阅读全文
摘要:
Long LongWritable Integer IntWritable Boolean BooleanWritable String Text 1.java类型转化为hadoop基本类型 调用hadoop类型的构造方法,或者调用set()方法。 new LongWritable(123L... 阅读全文
摘要:
RPC(remote process call)远程过程调用:不同java进程间的对象方法的调用。是hadoop框架运行的基础,hadoop建立在c/s基础之上。(源码中src/core/ipc/rpc.java体现)1.一方称作服务端(server),一方称作客户端(client)。 serve... 阅读全文
摘要:
mvn compile/test都没报错,但是执行mvn package和mvn clean时候就报错:a required class was missing while executing.......这时候只要更改中央仓库就可以解决问题了,具体步骤如下:1.默认中央仓库在C盘.m2中,这样非常... 阅读全文
摘要:
1 IntelliJ IDEA是一款非常优秀的JAVA编辑器,是jetbrain开发的一个IDE,用于Java、Groovy、Scala等的开发,自称是当前最智能的Java开发环境(The most intelligent IDE for Java platform),相对于其他开发工具来说,其对于... 阅读全文
摘要:
1.最小错误率贝叶斯决策2.最小风险叶斯决策在模式分类的决策中,最小错误率的原则是重要的,但实际上我们有可能关心的不仅仅是错误率,而是错误所带来的损失或风险。而风险又是和损失紧密相连的,所谓最小风险贝叶斯决策就是考虑各种错误造成损失不同时而提出的一种决策规律,而基于最小错误率的贝叶斯决策不能确定决策... 阅读全文