摘要: .1) 语法表示在语法上,为了支持assertion,Java增加了一个关键字assert。它包括两种表达式,分别如下:assert expression1;assert expression1: expression2;在两种表达式中,expression1表示一个boolean表达式,expression2表示一个基本类型或者是一个对象(Object) ,基本类型包括boolean,char,double,float,int和long。由于所有类都为Object的子类,因此这个参数可以用于所有对象。1.2) 语义含义在运行时,如果关闭了assertion功能,这些语句将不起任何作用。如果打 阅读全文
posted @ 2013-09-05 10:21 成风魄郎 阅读(364) 评论(0) 推荐(0) 编辑
摘要: (1) 寄存器(register)。这是最快的保存区域,这是主要由于它位于处理器内部。然而,寄存器的数量十分有限,所以寄存器是需要由编译器分配的。我们对此没有直接的控制权,也不可能在自己的程序里找到寄存器存在的任何踪迹。(2) 堆栈(stack)。位于通用RAM(随机访问存储器)中。可通过它的“堆栈指针” 获得处理的直接支持。堆栈指针若向下移,会创建新的内存;若向上移,则会释放那些内存。这是一种特别快、特别有效的数据保存方式,仅次于寄存器。创建程序时,Java编译器必须准确地知道堆栈内保存的所有数据的“长度”以及“存在时间” 。这是由于它必须生成相应的代码,以便向上和向下移动指针。这一限制无疑 阅读全文
posted @ 2013-09-03 22:42 成风魄郎 阅读(563) 评论(0) 推荐(0) 编辑
摘要: Oracle Berkeley DB Java 版是一个开源的、可嵌入的事务存储引擎,是完全用 Java 编写的。它充分利用 Java 环境来简化开发和部署。Oracle Berkeley DB Java 版的架构对于读密集型和写密集型的负载提供非常高的性能和并发性。您可以根据需要选择 Berkeley DB Java 版的 Direct Persistence Layer (DPL)、Persistent Collections API 或只存储任意数据的键/值对。如果关系数据库无法满足您的应用程序要求,那么 Berkeley DB Java 版将是您的最佳选择。大多数 Java 解决方案都 阅读全文
posted @ 2013-09-03 20:36 成风魄郎 阅读(448) 评论(0) 推荐(0) 编辑
摘要: ACID,指数据库事务正确执行的四个基本要素的缩写。包含:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)。一个支持事务(Transaction)的数据库系统,必需要具有这四种特性,否则在事务过程(Transaction processing)当中无法保证数据的正确性,交易过程极可能达不到交易方的要求。 阅读全文
posted @ 2013-09-03 18:54 成风魄郎 阅读(152) 评论(0) 推荐(0) 编辑
摘要: volatile的作用: 作为指令关键字,确保本条指令不会因编译器的优化而省略,且要求每次直接读值.简单地说就是防止编译器对代码进行优化.比如如下程序:XBYTE[2]=0x55;XBYTE[2]=0x56;XBYTE[2]=0x57;XBYTE[2]=0x58;对外部硬件而言,上述四条语句分别表示不同的操作,会产生四种不同的动作,但是编译器就不能像对待纯粹的程序那样对上述四条语句进行优化,只认为XBYTE[2]=0x58(即忽略前三条语句,只产生一条机器代码)。如果键入volatile,则编译器会逐一的进行编译并产生相应的机器代码 阅读全文
posted @ 2013-09-02 21:28 成风魄郎 阅读(150) 评论(0) 推荐(0) 编辑
摘要: 开博客以及建立Heritrix 群有一段时间了(这里谢谢大家的关注),这篇博客将整理这段时间所遇到的问题.同时由于自己从今年5月份开始就不怎么接触Heritrix,很多东西开始遗忘(不过里面思想没忘),同时目前的工作也没有必要接触Heritrix,所以不可能向之前写博客那样从源码的角度去考虑了.这里就起个抛砖引玉的作用吧,希望能有点用.这篇博客会不断更新,如有其他问题,请留言......相关问题: 1.Heritrix散列30个DNS后就结束 2.如何用Heritrix实现增量抓取,也就是抓取更新了的网页1.Heritrix散列30个DNS后就结束: 总体来说,是30个抓取线程去获取网站数据发 阅读全文
posted @ 2013-09-01 17:36 成风魄郎 阅读(314) 评论(0) 推荐(0) 编辑
摘要: 近段时间在搞定Lucene的一些问题,所以Heritrix源码分析暂时告一段落。今天下午在群里有同学提到了Heritrix异常终止的问题以及让Heritrix不停的抓取(就是抓完一遍后载入种子继续抓取,目前他是写个定时器,定时检查Heritrix是否停止,如果停止了则重新初始化Heritrix,让Heritrix重新抓取,但这个方法就不可避免的会导致抓取重复URl,除非从recover.gz导入)。我想这2个问题都可以用我下面这个方法,但对于Heritrix异常终止的问题这个方法也只是治标不治本,要改动的地方蛮多,涉及到Heritrix的设计以及结构,不是一时可以完成。下面就介绍原理以及方法: 阅读全文
posted @ 2013-09-01 17:35 成风魄郎 阅读(374) 评论(0) 推荐(0) 编辑
摘要: 通常,在我们实现多线程使用的计数器或随机数生成器时,会使用锁来保护共享变量。这样做的弊端是如果锁竞争的太厉害,会损害吞吐量,因为竞争的同步非常昂贵。volatile 变量虽然可以使用比同步更低的成本存储共享变量,但它只可以保证其他线程能够立即看到对 volatile 变量的写入,无法保证读 - 修改 - 写的原子性。因此,volatile 变量无法用来实现正确的计数器和随机数生成器。从 JDK 5 开始,java.util.concurrent.atomic包中引入了原子变量,包括 AtomicInteger、AtomicLong、AtomicBoolean 以及数组 AtomicInterg 阅读全文
posted @ 2013-08-31 23:20 成风魄郎 阅读(1947) 评论(0) 推荐(0) 编辑
摘要: java语言的关键字,变量修饰符,如果用transient声明一个实例变量,当对象存储时,它的值不需要维持。Java的serialization提供了一种持久化对象实例的机制。当持久化对象时,可能有一个特殊的对象数据成员,我们不想用serialization机制来保存它。为了在一个特定对象的一个域上关闭serialization,可以在这个域前加上关键字transient。当一个对象被序列化的时候,transient型变量的值不包括在序列化的表示中,然而非transient型的变量是被包括进去的。 阅读全文
posted @ 2013-08-31 17:34 成风魄郎 阅读(169) 评论(0) 推荐(0) 编辑
摘要: 类型兼容原则是指在需要基类对象的任何地方,都可以使用公有派生类的对象来替代。通过公有继承,派生类得到了基类中除构造函数、析构函数之外的所有成员。这样,公有派生类实际具备了基类的所有功能,凡是基类能解决的问题,公有派生类都可以解决。类型兼容原则中所指的替代包含以下情况。(1)派生类的对象可以隐含转换为基类对象。(2)派生类的对象可以初始化基类的对象。(3)派生类的指针可以隐含转换为基类的指针。在替代后,派生类对象就可以作为基类的对象使用,但只能使用从基类继承的成员。 阅读全文
posted @ 2013-08-28 23:46 成风魄郎 阅读(486) 评论(0) 推荐(0) 编辑