摘要:
多表关联 多表关联和单表关联类似,它也是通过对原始数据进行一定的处理,从其中挖掘出关心的信息。下面进入这个实例。1 实例描述 输入是两个文件,一个代表工厂表,包含工厂名列和地址编号列;另一个代表地址表,包含地址名列和地址编号列。要求从输入数据中找出工厂名和地址名的对应关系,输出"工厂名——地址名"表。 样例输入如下所示。 1)factory: factoryname addressed Beijing Red Star 1Shenzhen Thunder 3Guangzhou Honda 2Beijing Rising 1Guangzhou Develo... 阅读全文
摘要:
undo日志有一个潜在的问题,即我们在将书屋改变的所有数据写到磁盘前不能提交该事务。有时,如果让数据库修改暂时只存在于主存中,我们可以节省磁盘IO;只要在崩溃发生时有日志可以恢复,这样做就是安全的。如果我们使用redo日志机制,立即将数据元素备份到磁盘的需要就可以被避免。redo日志和undo日志的主要区别是:1. undo日志在恢复时消除未完成事务的影响并忽略已提交事务,而redo日志忽略未完成的事务并重复已提交事务所做的改变。2. undo日志要求我们在COMMIT日志记录达到磁盘前将修改后的数据元素写到磁盘,而redo日志要求COMMIT记录在任何修改后的值到达磁盘前出现在磁盘上3. 当 阅读全文
摘要:
checkpoint 检查点checkpoint,即检查点。在undolog中写入检查点,表示在checkpoint前的事务都已经完成commit或者rollback 了,也就是检查点前面的事务已经不存在数据一致性的问题了。那这个checkpoint如何去实现呢。其实实现的机制很简单,就是周期性的往 undolog里面写入。当然这个写入肯定不是随随便便的往里写,在往里写的时候,肯定要检查前面的事务是否完成。这个时候就会带来一个问题,因为数据库是一直在运行的,也就是事务是在不断启动的,同时可能有n个事务已经处于开始状态。而在检查点往里写的时候,可能又有新的事务启动了,如果让检查点一直等到没有新的 阅读全文
摘要:
1.继承(1)创建子类对象的时候,在子类对象中会为子类对象的字段开辟空间,也会为父类的所有字段开辟空间,只不过父类私有的成员访问不到(2)子类从父类继承父类所有的非私有成员,但是父类的所有字段也会创建,只不过父类私有的成员访问不到(3)base关键字可以调用父类的非私有成员(4)子类的访问级别不能比父类高,原因是访问子类的同时也访问了父类,如果子类的访问级别不能比父类高,就矛盾了(5)创建子类的时候,会先调用子类的构造函数,然后调用父类的构造函数,然后执行父类的构造函数,最后再执行子类的构造函数(6)子类的构造函数后面默认加了一个:base()通过这个调用父类的无参构造函数,如果父类没有无参数 阅读全文
摘要:
1、“*”符号:用于匹配前面一个普通字符的0次或多次重复,如hel*o ->helo、hello、helllo等2、“.”符号:用于匹配任意一个字符,如...73. ->xcb738、 x b738等3、“^”符号:用于匹配行首,如^cloud ->以cloud开头的行4、“$”符号:用于匹配行尾,如cloud$ ->以cloud结尾的行 ^$:表示空行5、“[]”符号:用于匹配字符集合,如[0123456789] [0-9] [a-z][A-Z]等 [^b-d]不在b-d范围内的字符6、“\”符号:用于屏蔽一个元字符的特殊意义,如\.标识一个符号.7、“\\”符号:精 阅读全文
摘要:
1 select id, 2 name, 3 sum(decode(tag_name, 'AAA', nvl(value, 0),'BBB' ,nvl(value, 0),0)) "imp_value", 4 sum(decode(tag_name, 'C01', nvl(value, 0),'D01', nvl(value, 0), 0)) "click_value" 5 6 from (SELECT a.id, a.name, d.tag_name, d.value 7 FROM A a 阅读全文
摘要:
1.确定集群的结构IP(主机名)角色192.168.1.220(hadoop0)NameNode、JobTracker192.168.1.221(hadoop1)SecondaryNameNode192.168.1.222(hadoop2)DataNode、TaskTracker192.168.1.223(hadoop3)DataNode、TaskTracker由于SecondaryNameNode是执行合并任务的,内存占用特别大,所以单独一台大内存的节点。以上4个ip可以是单独的物理机,也可以是虚拟机。生产环境中,一般是物理机。假设各节点安装的linux版本完全一致。假设各ip已经设置完成了 阅读全文
摘要:
网络中对电脑的访问是通过ip定位的。就好像我们的身份证号,可以唯一辨识一个人。ip是用来区分网络中的电脑的,因此同一网络(准确讲是“网段”)中,ip地址不能相同。如果同一网络中有相同的ip存在,经常发生无法联网或者经常掉线的情况。网络是分段管理的。拿局域网为例,我们通常的网段是192.168.1.xxx。我们的ip地址就是把xxx成1到254的数字。如果多台计算机的ip的前面数字都是192.168.1,那么就叫做属于同一个网段,他们之间是可以互相通信的。如果一台机器的ip是192.168.1.100,另一台机器的ip是192.168.3.100,正常情况下,不能互相通信的(有办法可以搞定,我们 阅读全文
摘要:
1、哪些对象可以被回收1)、引用计数算法:这个算法有一个致命的缺陷,那就是对于循环引用的对象无法进行回收。 2)、根搜索算法:设立若干种根对象,当任何一个根对象到某一个对象均不可达时,则认为这个对象是可以被回收的。 在JAVA语言中,可以当做GC roots的对象有以下几种: 1、虚拟机栈中的引用的对象。 2、方法区中的类静态属性引用的对象。 3、方法区中的常量引用的对象。 4、本地方法栈中JNI的引用的对象。第一和第四种都是指的方法的本地变量表,第二种表达的意思比较清晰,第三种主要指的是声明为final的常量值。2、何时回收这些对象、采用什么样的方式回收 1)标记/清... 阅读全文
摘要:
1 安装Vmware WorkStation软件有些人会问,为何要安装这个软件,这是一个VM公司提供的虚拟机工作平台,后面需要在这个平台上安装linux操作系统。具体安装过程网上有很多资料,这里不作过多的说明。2 在虚拟机上安装linux操作系统在前一步的基础之上安装linux操作系统,因为hadoop一般是运行在linux平台之上的,虽然现在也有windows版本,但是在linux上实施比较稳定,也不易出错,如果在windows安装hadoop集群,估计在安装过程中面对的各种问题会让人更加崩溃,其实我还没在windows上安装过,呵呵~在虚拟机上安装的linux操作系统为ubuntu10.0 阅读全文