2014年7月28日

hadoop 1.2.1 安装步骤 伪分布式

摘要: 最近在系统的学习hadoop 课程第一步是安装hadoop1.x,具体安装步骤如下: 一、系统安装 本文使用centos6.5安装,具体安装步骤省略 二、jdk安装 下载jdk1.7.0_51解压,在环境中 设置环境变量: vi /etc/profile,添加如下行: export JAVA_... 阅读全文

posted @ 2014-07-28 10:50 封起De日子 阅读(127) 评论(0) 推荐(0) 编辑

记一次 java程序优化

摘要: 优化原因 环境中部署两个程序: web应用 tomcat 10G(webservice服务端,前端web服务)java应用 5G(webservice客户端,socket客户端) 之前的设计思路是打算web应用作为前端不做业务处理,后端使用webservice... 阅读全文

posted @ 2014-07-28 10:50 封起De日子 阅读(183) 评论(0) 推荐(0) 编辑

heritrix 3.2.0 下载

摘要: 由于archive.org屏蔽,编译完成版本 http://builds.archive.org/maven2/org/archive/heritrix/heritrix/3.2.0/ 无法下载。 现将dist版本放到github,方便大家下载学习 github地址如下: https:... 阅读全文

posted @ 2014-07-28 10:50 封起De日子 阅读(212) 评论(0) 推荐(0) 编辑

heritrix 3.2.0 -- 环境搭建

摘要: heritrix作为一个比较经典的开源爬虫,写这篇文章目的是因为,3.X之后的heritrix的介绍以及配置的文章比较少了。 heritrix 3.x 以后使用maven 2配置jar包引用,但是总是有好多包没法从maven库下载。所以,这里讲的环境搭建直接使用了编译好的工程来做,heritr... 阅读全文

posted @ 2014-07-28 10:50 封起De日子 阅读(247) 评论(0) 推荐(0) 编辑

spring 4 泛型注入

摘要: 最近对系统进行改造,发现在泛型实例初始化的时候,得不到想要的泛型。或者需要强制转换。 spring 4 开始支持泛型对象初始化,初始化方法如下: 注:使用配置文件的方法暂时还没有发现,下面是使用java annotation的方法: package com.mitchz..toolkit.cha... 阅读全文

posted @ 2014-07-28 10:50 封起De日子 阅读(98) 评论(0) 推荐(0) 编辑

系统监控的工具tsar

摘要: 近期一直在折腾着elasticsearch,需要对硬件进行评估 大概几方面 内存 cpu 硬盘 网络。 iostat vmstat top 几个命令用了一堆,其实需要关注的几个点只要都列出来就可以了 [root@cloud-15 tsar-master]# tsar -l -i 1Time... 阅读全文

posted @ 2014-07-28 10:50 封起De日子 阅读(154) 评论(0) 推荐(0) 编辑

haproxy简单负载均衡搭建

摘要: 最近对负载均衡进行搭建具体方法如下:haproxy 修改部分(haproxy-cfg.cfg)global daemon maxconn 4500 defaults mode http timeout connect 5000ms time... 阅读全文

posted @ 2014-07-28 10:50 封起De日子 阅读(190) 评论(0) 推荐(0) 编辑

elasticsearch 性能测试

摘要: 最近花很大的经历来做性能测试,把结果整理到了ppt中,可能有个别地方不准,但是可以看看一个趋势。 主要分为两部分,一部分是写入elasticsearch性能,一部分是查询测试,elasticsearch的查询性能。 当然在elasticsearch1.3.0之后elasticsearch会提供... 阅读全文

posted @ 2014-07-28 10:50 封起De日子 阅读(2953) 评论(2) 推荐(0) 编辑

centos 6.5 hadoop 2.3 初配置

摘要: 为了安装hadoop废了好大的劲才把esxi5.5给装好。 同时装了centos6.5,由于hadoop里面有个免密码登陆所以这里讲的就是免密码登陆。 看了大家的博客文章发现转发的一部分,写ubuntu的一部分,写centos的又有一部分。 可能自己理解的程度有限,现把解决的部分问题列出来,供... 阅读全文

posted @ 2014-07-28 10:49 封起De日子 阅读(153) 评论(0) 推荐(0) 编辑

esxi5.5 安装,虚拟机复制

摘要: 尝试在vmware workstation上安装hadoop,感觉太慢了。 好在家里的台式机配置还可以,所以就想在它上面虚拟出几台服务器出来。 台式机配置如下: 虚拟出来三个应该没问题了吧。 第一步,下载esix5.5(去官网上看是需要注册,然后就是无尽的等待) 网盘地址: http://p... 阅读全文

posted @ 2014-07-28 10:49 封起De日子 阅读(214) 评论(0) 推荐(0) 编辑

初识lucene

摘要: lucene的介绍网上有好多,再写一遍可能有点多余了。 使用lucene之前,有一系列的疑问 为什么lucene就比数据库快?倒排索引是什么,他是怎么做到的lucene的数据结构是什么样的,cpu消耗,内存消耗主要因为什么lucene的索引流程以及查询流程是什么样的 推荐两篇文章,更进一步了... 阅读全文

posted @ 2014-07-28 10:49 封起De日子 阅读(89) 评论(0) 推荐(0) 编辑

hadoop 2.3 集群总结

摘要: 用了近两个礼拜的摸索终于搭建好了hadoop集群,测试性能也符合预期。 centos6.4下hadoop2.3集群总结如下: 关于环境的设置: 1.关闭selinux (反复折腾了好多次) vi /etc/selinux/config ... 阅读全文

posted @ 2014-07-28 10:49 封起De日子 阅读(122) 评论(0) 推荐(0) 编辑

比较有用的log4j.properties

摘要: 转自 http://walsh.iteye.com/blog/314941 log4j.properties log4j.rootLogger=DEBUG,CONSOLE,DATABASE,FILE log4j.addivity.org.apache=true # 应用于控... 阅读全文

posted @ 2014-07-28 10:49 封起De日子 阅读(225) 评论(0) 推荐(0) 编辑

dubbo初体验

摘要: 最近需要开发部门中某个大数据量的提取的功能,加到了一个ElasticSearch的群。在群里听说到一个框架叫dubbo,阿里系开源软件。听到群友谈的神乎其神的,什么什么功能切分多协议栈,高并发等等等。最最重要的一点,还有一个控制台,计数器。于是联想到了手头的一个功能的优化。现状是这样... 阅读全文

posted @ 2014-07-28 10:49 封起De日子 阅读(89) 评论(0) 推荐(0) 编辑

highchart 实现mrtg

摘要: 最近需要对流量图进行重构, 流入流出 效果如下: 大小: 25.7 KB 大小: 18.7 KB 查看图片附件 阅读全文

posted @ 2014-07-28 10:49 封起De日子 阅读(146) 评论(0) 推荐(0) 编辑

iostat 离线安装

摘要: 由于lucene需要一定的io读写顾安装iostat来对磁盘io进行监控 iostat 属于sysstat下的功能 git路径如下:https://github.com/sysstat/sysstat 第一步,需要下载该文件 http://sebastien.godard.pagesperso... 阅读全文

posted @ 2014-07-28 10:49 封起De日子 阅读(1551) 评论(0) 推荐(0) 编辑

log4j日志分模块打印,同时不打印到控制台上

摘要: 由于定时刷新程序的启用,导致catalina.out配置文件中打入大量日志,致使程序调试困难。 无法正常查看日志。所以客户要求将性能流量配置日志迁移出catalina.out目录。修改log4j配置文件后,发现 分文件中有了日志输出,但... 阅读全文

posted @ 2014-07-28 10:49 封起De日子 阅读(1100) 评论(0) 推荐(0) 编辑

oracle pipelined返回值函数 针对数据汇总统计 返回结果集方法

摘要: 近期需要一个汇总统计,由于数据太多,数据量太大所以在java程序中实现比较困难。若用后台程序统计,数据不能保证实时,同时实现周期比较长。顾使用函数返回结果集的方式,在不增加临时表的情况下实时获取数据。需求为:多个端口流量每五分钟累计汇总一次。如果用程序实现则为讲所有数据取出做每五分钟统计,元数... 阅读全文

posted @ 2014-07-28 10:49 封起De日子 阅读(228) 评论(0) 推荐(0) 编辑

ElasticSearch大批量数据入库

摘要: 最近着手处理大批量数据的任务。 现状是这样的,一个数据采集程序承载大批量数据的存储和检索。后期可能需要对大批量数据进行统计。 数据分布情况 13个点定时生成采集结果到4个文件(小文件生成周期是5分钟) 名称 ... 阅读全文

posted @ 2014-07-28 10:49 封起De日子 阅读(1157) 评论(0) 推荐(0) 编辑

总结spring下配置dbcp,c3p0,proxool数据源链接池

摘要: 转载自 http://hiok.blog.sohu.com/66253191.html applicationContext-datasource-jdbc.xml datasource ${jdbc.driverClassName} ${jdbc.url} ${jd... 阅读全文

posted @ 2014-07-28 10:48 封起De日子 阅读(116) 评论(0) 推荐(0) 编辑

导航