上一页 1 ··· 4 5 6 7 8 9 10 11 下一页
摘要: HTMLParser获取属性名方式:原始网页文本:1 美军被曝虐尸2温岭鞋厂大火32014春运全国启动4汪峰章子怡同居5透视年会经过parser处理后文本:parser匹配代码:1 NodeFilter filter1 = new HasAttributeFilter("a");2 NodeFilter filter2 = new HasAttributeFilter("title");3 4 5 //NodeFilter innerFilter = new TagNameFilter ("... 阅读全文
posted @ 2014-01-16 16:16 wq920 阅读(588) 评论(0) 推荐(0) 编辑
摘要: HTMLParser具有小巧,快速的优点,缺点是相关文档比较少(英文的也少),很多功能需要自己摸索。对于初学者还是要费一些功夫的,而一旦上手以后,会发现HTMLParser的结构设计很巧妙,非常实用,基本你的各种需求都可以满足。这里我根据自己这几个月来的经验,写了一点入门的东西,希望能对新学习HTMLParser的朋友们有所帮助。HTMLParser的核心模块是org.htmlparser.Parser类,这个类实际完成了对于HTML页面的分析工作。这个类有下面几个构造函数: 1 public Parser ();2 public Parser (Lexer lexer, Par... 阅读全文
posted @ 2014-01-15 16:57 wq920 阅读(310) 评论(0) 推荐(0) 编辑
摘要: Callable与Future两功能是Java在后续版本中为了适应多并法才加入的,Callable是类似于Runnable的接口,实现Callable接口的类和实现Runnable的类都是可被其他线程执行的任务。Callable的接口定义如下:1 public interface Callable { 2 3 V call() throws Exception; 4 5 } Callable和Runnable的区别如下:I Callable定义的方法是call,而Runnable定义的方法是run。II Callable的call方法可以有返回值,而Runnable... 阅读全文
posted @ 2014-01-06 17:47 wq920 阅读(244) 评论(0) 推荐(0) 编辑
摘要: FROM:http://www.cnblogs.com/wufengxyz/archive/2011/11/24/2261797.html1.什么是antant是构建工具2.什么是构建 概念到处可查到,形象来说,你要把代码从某个地方拿来,编译,再拷贝到某个地方去等等操作,当然不仅与此,但是主要用来干这个3.ant的好处 跨平台 --因为ant是使用java实现的,所以它跨平台 使用简单--与ant的兄弟make比起来 语法清晰--同样是和make相比 功能强大--ant能做的事情很多,可能你用了很久,你仍然不知道它能有多少功能。当你自己开发一些ant插件的时候,你会发现它更多的功能。4.... 阅读全文
posted @ 2014-01-03 13:21 wq920 阅读(706) 评论(0) 推荐(1) 编辑
摘要: 输入框景背景透明:1 鼠标划过输入框,输入框背景色变色: 1 输入字时输入框边框闪烁(边框为小方型): 输入字时输入框边框闪烁(边框为虚线): 自动横向廷伸的输入框:1 自动向下廷伸的文本框:1 80) 3 this.style.posHeight=this.scrollHeight+5">输入几个回车试试只有下划线的文本框: 1 软件序列号式的输入框: 1 5 6 — 7 — 8 — 9 —10 —软件序列号式的输入框(完整版): ————— 阅读全文
posted @ 2014-01-02 16:26 wq920 阅读(643) 评论(0) 推荐(0) 编辑
摘要: FROM:http://blog.csdn.net/dyllove98/article/details/7772463JdbcTemplate主要提供以下五类方法:execute方法:可以用于执行任何SQL语句,一般用于执行DDL语句;update方法及batchUpdate方法:update方法用于执行新增、修改、删除等语句;batchUpdate方法用于执行批处理相关语句;query方法及queryForXXX方法:用于执行查询相关语句;call方法:用于执行存储过程、函数相关语句。JdbcTemplate类支持的回调类:预编译语句及存储过程创建回调:用于根据JdbcTemplate提供的 阅读全文
posted @ 2013-12-27 13:57 wq920 阅读(661) 评论(0) 推荐(0) 编辑
摘要: FROM:http://blog.csdn.net/pennyliang/article/details/1231028 我们已经谈过了如何自动下载网页、如何建立索引、如何衡量网页的质量(Page Rank)。我们今天谈谈如何确定一个网页和某个查询的相关性。了解了这四个方面,一个有一定编程基础的读者应该可以写一个简单的搜索引擎了,比如为您所在的学校或院系建立一个小的搜索引擎。] 我们还是看上回的例子,查找关于“原子能的应用”的网页。我们第一步是在索引中找到包含这三个词的网页(详见关于布尔运算的系列)。现在任何一个搜索引擎都包含几十万甚至是上百万个多少有点关系的网页。那么哪个应该排在前面... 阅读全文
posted @ 2013-12-24 11:47 wq920 阅读(2163) 评论(0) 推荐(0) 编辑
摘要: 1.安装部署1.1 环境要求1.使用的JDK的版本必须是1.6或者更高版本,本实例中使用的是JDK1.62.使用的hadoop的版本必须是Hadoop0.20.205.1及以上版本,本实例中使用的是Hadoop1.0.1版本。3.为了运行HICC,需要使用HBase0.90.4版本1.2 版本选择 这里使用0.5版本1.3 执行步骤1.首先下载的chukwa的版本是0.5版本,下载链接如下:http://labs.renren.com/apache-mirror/incubator/chukwa/chukwa-0.5.0/下载如下的两个文件:chukwa-incubating-0.5.0.t. 阅读全文
posted @ 2013-12-02 17:23 wq920 阅读(2626) 评论(0) 推荐(0) 编辑
摘要: FROM:http://go-on.iteye.com/blog/1789466背景 Google、Facebook、Amazon等互联网巨头对于数据的创造性使用,创造出了很多辉煌的商业产品。如Amazon创造出的新的推荐模式:”查询此商品的顾客也查询了。。。。。”、“看过此商品的后的顾客买的其他商品有。。。。。。”、“购买了您最近浏览过的商品的顾客同时购买了。。。。。。”,还有LinkedIn公司创造的“你可能认识的人”。这些机制无不是建立在大量数据分析的基础上。分布式日志方案 作为互联网公司,每天庞大的日志数据将是一笔宝贵的财富,对大规模日志数据进行采集、追踪、处理将是非常有收益的。一.. 阅读全文
posted @ 2013-12-02 16:57 wq920 阅读(11293) 评论(0) 推荐(1) 编辑
摘要: From:http://tech.uc.cn/?p=817问题背景:初步了解Impala的应用重点测试Impala的查询速度是否真的如传说中的比Hive快3~30倍写作目的:了解Impala的安装过程初步了解Impala的使用比较Impala与Hive的性能测试适合阅读对象:想了解Impala安装的读者想了解Impala与Hive性能比较的读者不涉及的内容:如何安装Hadoop(假设你已经安装好了Hadoop)如何安装Hive(假设你已经安装好了Hive)关于Hadoop和Hive的安装,可参考我们公司一位Hadoop牛人写的Hadoop一键安装(里面包含了Hive的安装) https://g 阅读全文
posted @ 2013-11-24 14:04 wq920 阅读(784) 评论(0) 推荐(1) 编辑
上一页 1 ··· 4 5 6 7 8 9 10 11 下一页