随笔档案「2012年8月」 - 草原和大树

分布式搜索方案选型

摘要：分布式搜索方案选型之一：Solr我第一个了解到的分布式搜索框架是solr,它是由java开发的，基于lucene的分布式搜索引擎，提供了类似于webserver的编程接口，是一个比较成熟的搜索引擎，目前很多公司都在使用。很快我就部署了一个由4台机器组成的solr集群，开始导公司的数据进去测试，导的数据为200万。导入速度非常快。接下来就开始测试查询效率，发现它是有缓存的，第一次查询的时间基本上在80～150毫秒之间，第二次查由于有缓存，查询时间基本上只需要18~35毫秒，可以说非常之快。它如何做到分布式？因为现在做的是集群，每台机器存储的信息是一样的，怎样做到把索引信息进行拆分？于是就到sol 阅读全文

posted @ 2012-08-29 22:00 草原和大树阅读(5845) 评论(1) 推荐(2)

JAVA中 @Override 的作用

摘要：如果想重写父类的方法，比如toString()方法的话，在方法前面加上@Override系统可以帮你检查方法的正确性，@Overridepublic String toString(){...}这是正确的一旦写错写成这样@Overridepublic String tostring(){...}编译器可以检测出这种写法是错误的这样能保证你的确重写的方法正确而如果不加@Overridepublic String tostring(){...}这样编译器是不会报错的它只会认为这是你自己新加的一个方法而已---------------------------------------------- 阅读全文

posted @ 2012-08-24 17:33 草原和大树阅读(1831) 评论(0) 推荐(0)

java中FileInputStream,FileReader等的区别

摘要：FileInputStream,FileReaderC语言只需要一个File*就可以了，与C不同，java有一系列流类型，其数量超过60种。类库的设计者声称：“有足够的理由为用户提供丰富的流类型的选择：这样做可以减少程序的错误。”例如，在C语言种，许多人认为“将输出流写入一个只读模式的文件”是很常见的错误。（事实上，这并不常见。）我们认为在C＋＋语言中，流接口设计者避免程序出错的主要“工具”是小心谨慎的态度，在java语言中更是如此。流库的高度复杂性迫使程序设计人员谨小慎微。1. File类1）File类介绍（《core java》638页）File类封装了对用户机器的文件系统进行操作的功能。阅读全文

posted @ 2012-08-24 16:44 草原和大树阅读(5024) 评论(0) 推荐(0)

Java中对象序列化的作用

摘要：1、序列化是干什么的？简单说就是为了保存在内存中的各种对象的状态，并且可以把保存的对象状态再读出来。虽然你可以用你自己的各种各样的方法来保存Object States，但是Java给你提供一种应该比你自己好的保存对象状态的机制,那就是序列化。 2、什么情况下需要序列化 a）当你想把的内存中的对象保存到一个文件中或者数据库中时候； b）当你想用套接字在网络上传送对象的时候； c）当你想通过RMI传输对象的时候； 3、当对一个对象实现序列化时，究竟发生了什么？在没有序列化前，每个保存在堆（Heap）中的对象都有相应的状态（state），即实例变量（instance ariabl... 阅读全文

posted @ 2012-08-24 15:13 草原和大树阅读(1016) 评论(0) 推荐(0)

Java序列化与反序列化（实践）

摘要：基本概念：序列化是将对象状态转换为可保持或传输的格式的过程。与序列化相对的是反序列化，它将流转换为对象。这两个过程结合起来，可以轻松地存储和传输数据。昨天在一本书上看到了，好好实践了一下，序列化为一般文件，也序列化为XML文件（使用XStream）。用于序列化的实体类Person.java 代码如下（记得需要实现Serializable接口）：import java.io.Serializable;@SuppressWarnings("serial")public class Person implements Serializable{ private String na 阅读全文

posted @ 2012-08-24 15:09 草原和大树阅读(1402) 评论(0) 推荐(0)

新浪微博API使用方法

摘要：2012.7.4注：好多人反映按照日志中的方法做不能出结果，不知道是不是新浪微博的API变了，貌似日志中提到的方法和解决办法都不行了……这是我寒假时写的，可能有些过时了。建议看一下官方文档和开发者论坛，可能会有些帮助。实验室的活儿要用新浪微博API，所以学习了一下，简单记录一下吧。首先，你要有一个新浪微博账号。然后，登陆http://wwv.renren.com/xn.do?ss=10791&rt=1，点击创建应用（如下图）类型、名称等等各种信息随便填，创建好了之后，点击管理应用（如上图），就会出现你刚刚创建的应用，点击应用详情。然后点击上图中的应用信息，会看到App Key和App 阅读全文

posted @ 2012-08-17 10:33 草原和大树阅读(5816) 评论(0) 推荐(1)

HBase数据库性能调优

摘要：因官方Book Performance Tuning部分章节没有按配置项进行索引，不能达到快速查阅的效果。所以我以配置项驱动，重新整理了原文，并补充一些自己的理解，如有错误，欢迎指正。配置优化 zookeeper.session.timeout 默认值：3分钟(180000ms) 说明：RegionServer与Zookeeper间的连接超时时间。当超时时间到后，ReigonServer会被Zookeeper从RS集群清单中移除，HMaster收到移除通知后，会对这台server负责的regions重新balance，让其他存活的RegionServer接管. 调优：这个timeo... 阅读全文

posted @ 2012-08-16 11:08 草原和大树阅读(945) 评论(0) 推荐(0)

Hadoop安装记录

摘要：http://www.cnblogs.com/JemBai/admin/EditPosts.aspx?opt=1 阅读全文

posted @ 2012-08-14 18:16 草原和大树阅读(339) 评论(0) 推荐(0)

跨部门业务合作

摘要：1、及时沟通。2、态度谦逊。3、及时响应。4、及时反馈问题处理情况。5、通知全上下游。阅读全文

posted @ 2012-08-08 12:03 草原和大树阅读(474) 评论(0) 推荐(0)

Linux文件夹大小查看办法

摘要：1. du -sh 查看当前文件夹大小如下： Info代码 $du -sh 7.0M xxx.log $du -sh 7.0M xxx.log 2. du -sh * | sort -n 列出当前文件夹下的所有文件夹及其大小，并按照文件夹大小排序如下： Info代码 $du -sh * | sort -n 4.0K xxx.log 4.0K xxx.log 4.4M xxx.log 4.8M xxx.log $du -sh * | sort -n 4.0K xxx.log 4.0K xxx.log 4.4M xxx.log 4.8M xxx.log 3. ... 阅读全文

posted @ 2012-08-06 17:22 草原和大树阅读(683) 评论(0) 推荐(0)