摘要: 为什么要用Hbase- Hbase的诞生是因为现有的关系型数据库已经无法在硬件上满足疯狂增长的数据了,而且因为需要实时的数据提取Memcached也无法满足- Hbase适合于无结构或半结构化数据,适合于schema变动的情况- Hbase天生适合以时间轴做查询 Werner Vogels,可以关注一下他的博客(Amazon的CTO) 分布式计算系统的CAP定理:在理論計算機科學中, CAP定理... 阅读全文
posted @ 2014-05-04 21:13 Elaine Shi 阅读(3927) 评论(0) 推荐(2) 编辑
摘要: Upcast永远是成功的,但Downcast不是,记得做instanceof判断 仅抛不同异常,而返回值相同的重载是不可以的 static import只会import静态类 static method内不能使用this和super,不能用super! 只有static nested class能有静态成员,其它nested不能有,且静态嵌入类可以访问外围类的... 阅读全文
posted @ 2013-08-19 01:08 Elaine Shi 阅读(741) 评论(0) 推荐(0) 编辑
摘要: Answers with Explanations 1. c) s1 and s2 not equal s1 and s3 equal JVM sets a constant pool in which it stores all the string constants used in the type. If two references are declared... 阅读全文
posted @ 2013-07-15 00:10 Elaine Shi 阅读(731) 评论(0) 推荐(0) 编辑
摘要: 考试的宗旨仍然是掌握基础知识,不过鉴于Oracle的这个认证考试还有不少的大家来找茬的成份在,所以一定一定要细心为上。 关于抽象类的坑点集合: 抽象类不是必须得有抽象方法,但有抽象方法的类必须是抽象类必须加上abstract 抽象类里面可以有非抽象方法(有body),或抽象方法定义,即abstract void doit(); 接口是extends接口,别被坑了... 阅读全文
posted @ 2013-07-14 23:34 Elaine Shi 阅读(985) 评论(0) 推荐(0) 编辑
摘要: 首先来了解一下HDFS的一些基本特性 HDFS设计基础与目标 硬件错误是常态。因此需要冗余 流式数据访问。即数据批量读取而非随机读写,Hadoop擅长做的是数据分析而不是事务处理 大规模数据集 简单一致性模型。为了降低系统复杂度,对文件采用一次性写多次读的逻辑设计,即是文件一经写入,关闭,就再也不能修改 程序采用“数据就近”原则分配节点执行 HDFS... 阅读全文
posted @ 2013-05-18 23:16 Elaine Shi 阅读(10352) 评论(0) 推荐(0) 编辑
摘要: 一、IIS6,安装全部包括CGI,ASP,ASP.NET,ISAPI Flters, ISAPI Extension等 二、在IIS中添加一个SITE 1. 按如下图 2. 配置权限 以上设置会出现以下带下划线的配置 <system.web> < compilation debug ="false " targetFramework ="4.0 "... 阅读全文
posted @ 2013-05-11 22:19 Elaine Shi 阅读(2515) 评论(0) 推荐(0) 编辑
摘要: 注:文中的方法非常简单,使用MySQL导出表到XML,发送邮件到你的为知/Evernote邮箱账户即可,唯一目前没找到破的是SMTP常随机无响应.. 而且象GMAIL的SMTP有发送次数限制(一天一千左右吧,所以如果有超过的话可能需要更换账号再试,当然你也可以改良下,做个数组,遇到配额错误可以提取下一个SMTP信息),优点是利用邮件的方式可以将博客中的图片也能导入到笔记中(而不是用的图片原链接,是直接放进笔记)日志导入Wiz的结果:一、目的很简单,我担心博客放在网上有一天会不见了,所以一直想存到本地,博客太多,手动已不可能我这些年使用wordpress有上千篇博客,其中有8成都是私有,使用现在 阅读全文
posted @ 2013-05-11 20:41 Elaine Shi 阅读(2743) 评论(4) 推荐(1) 编辑
摘要: 为什么会将Page Rank放在hadoop学习笔记里,是因为hadoop课程第一周就重点提到了Google当年三大论文(GFS, Map-Reduce和Big Table)以及hadoop思想的来源,并提到了page rank与Map-reduce解决方案下的PR算法,关于如何应用分布式计算来处理上万亿网页的Page rank的Map-reduce思想现在还没有搞清楚,在这之前,颇费了些周章去理解page rank的基本算法。有几篇文章讲述得非常清楚,(更是觉得数学是趋势所需,没有好的数学包括线性/高数/离散等很多路径将走不通)说实话,培训课件中关于Page Rank算法的讲解实在是太抽象了 阅读全文
posted @ 2013-05-08 23:59 Elaine Shi 阅读(4735) 评论(4) 推荐(0) 编辑
摘要: 本篇讲了在Ubuntu下安装hadoop0.20.2完全分布式集群的过程 阅读全文
posted @ 2013-05-08 23:18 Elaine Shi 阅读(69553) 评论(9) 推荐(2) 编辑
摘要: 本贴没啥干货,纯碎只是记录下写过的代码,路过的大侠们可以绕道走~背景:项目的多语化的Message使用的是:用XML Messages.xml 来存放languages resource使用C# MessageKeys 类存放所有Message key及其在XML资源文件中的对应Message ID在代码中调用这个MessageKey现在,项目有个Refactor工作,他们设计了更高一级别的Common Message,这样就不希望各个子项目中的message太繁杂难管理,而我“不幸”被分派了这个比较坑妈的活,就是将我当时所在项目的近2000条Message的一条一条的整理查看,并将可以转换成 阅读全文
posted @ 2013-04-14 23:16 Elaine Shi 阅读(517) 评论(0) 推荐(0) 编辑