摘要: 详细代码请见E:\Project\【重要】归档代码\SearchEngine归档代码或https://code.csdn.net/jediael_lu/jediael/tree/10991c839c51d32f825708b09451b2618a20ee94或http://download.csdn.net/detail/jediael_lu/7402827本版本完成以下功能:(1)创建用于保... 阅读全文
posted @ 2014-05-26 15:16 lujinhong2 阅读(138) 评论(0) 推荐(0) 编辑
摘要: 1、为什么要使用serialVersionUID(1)对于实现了Serializable接口的类,可以将其序列化输出至磁盘文件中,同时会将其serialVersionUID输出到文件中。(2)然后有需要使用时,再从磁盘将对象内容及serialVersionUID读入内容中的某个对象。(3)将磁盘内容... 阅读全文
posted @ 2014-05-24 11:02 lujinhong2 阅读(139) 评论(0) 推荐(0) 编辑
摘要: 1、区别(1)String构建的对象不能改变,每次对String进行操作时,如两个String相加,需要新建一个String对象,然后容纳最终的结果。 而StringBuilder与StringBuffer构建的对象可以随时在修改其内容,而无需生成新的对象。一般新建一个对象是会生成16个字节的空间,之后根据需要再增加空间。 由于一般新构建一个对象涉及分配内存空间分... 阅读全文
posted @ 2014-05-24 09:56 lujinhong2 阅读(320) 评论(0) 推荐(0) 编辑
摘要: (一)搜索引擎的开发一般可分为以下三大部分1、数据采集层:一般使用爬虫获取互联网的数据,重要的开源项目有Heritrxi2、数据分析处理层:将从互联网上获取到的数据进行提取归类、分词、语义分析得出索引得内容,等待用户查询使用,重要的开源项目有Lucene3、视图层:也用户的交互界面,如一个网站的首页其基本架构可参考下图:版权声明:本文为博主原创文章,未经博主允许不得转载。 阅读全文
posted @ 2014-05-23 16:00 lujinhong2 阅读(117) 评论(0) 推荐(0) 编辑
摘要: 部分内容参考《这就是搜索引擎》通用搜索引擎的处理对象是互联网网页,目前网页数量以百亿计,搜索引擎的网络爬虫能够高效地将海量的网页数据传下载到本地,在本地 形成互联网网页的镜像备份。它是搜索引擎系统中很关键也很基础的构件。(一)网络爬虫本质就是浏览器http请求浏览器和网络爬虫是两种不同的网络客户端,都以相同的方式来获取网页: 1、首先, 客户端程序连接到域名系统(DNS)服务器上,D... 阅读全文
posted @ 2014-05-23 14:44 lujinhong2 阅读(130) 评论(0) 推荐(0) 编辑
摘要: 详细可参考(1)书箱:《这就是搜索引擎》《自己动手写网络爬虫》《解密搜索引擎打桩实践》(2)【搜索引擎基础知识1】搜索引擎的技术架构(3)【搜索引擎基础知识2】网络爬虫的介绍(一)搜索引擎的开发一般可分为以下三大部分1、数据采集层:一般使用爬虫获取互联网的数据,重要的开源项目有Heritrxi2、数据分析处理层:将从互联网上获取到的数据进行提取归类、分词、语义分析得出索引得内容,等待用户查询... 阅读全文
posted @ 2014-05-23 14:07 lujinhong2 阅读(162) 评论(0) 推荐(0) 编辑
摘要: 部分内容转自:http://blog.csdn.net/hguisu/article/details/8024799一、 开源项目apache lucene是apache下一个著名的开源搜索引擎内核,基于Java技术,处理索引,拼写检查,点击高亮和其他分析,分词等技术。nutch和solr原来都是l... 阅读全文
posted @ 2014-05-23 11:44 lujinhong2 阅读(171) 评论(0) 推荐(0) 编辑
摘要: 1、相关资料官方文档:http://htmlparser.sourceforge.net/samples.htmlAPI:http://htmlparser.sourceforge.net/javadoc/index.html其它HTML 解释器:jsoup等。由于HtmlParser自2006年以... 阅读全文
posted @ 2014-05-22 11:33 lujinhong2 阅读(181) 评论(0) 推荐(0) 编辑
摘要: 截止目前,已完成如下功能:1、指定某个地址,使用HttpClient下载该网页至本地文件2、使用HtmlParser解释第1步下载的网页,抽取其中包含的链接信息3、下载第2步的所有链接指向的网页至本地文件下一步需要完成的功能:1、创建用于保存种子URL的配置文件及其数据结构2、创建用于保存Todo信... 阅读全文
posted @ 2014-05-21 21:35 lujinhong2 阅读(128) 评论(0) 推荐(0) 编辑
摘要: 学习金字塔是美国缅因州的国家训练实验室研究成果,它用数字形式形象显示了:采用不同的学习方式,学习者在两周以后还能记住内容(平均学习保持率)的多少。它是一种现代学习方式的理论。最早它是由美国学者、著名的学习专家爱德加·戴尔1946年首先发现并提出的。内容编辑在塔尖,第一种学习方式——“听讲”,也就是老... 阅读全文
posted @ 2014-05-21 09:25 lujinhong2 阅读(148) 评论(0) 推荐(0) 编辑
摘要: 关于HtmpParser的基本内容请见 HtmlParser基础教程本文示例用于提取HTML文件中的链接package org.ljh.search.html;import java.util.HashSet;import java.util.Set;import org.htmlparser.No... 阅读全文
posted @ 2014-05-20 20:50 lujinhong2 阅读(171) 评论(0) 推荐(0) 编辑
摘要: 转自:http://free0007.iteye.com/blog/1131163HTMLParser具有小巧,快速的优点,缺点是相关文档比较少(英文的也少),很多功能需要自己摸索。对于初学者还是要费一些功夫的,而一旦上手以后,会发现HTMLParser的结构设计很巧妙,非常实用,基本你的各种需求都... 阅读全文
posted @ 2014-05-19 21:46 lujinhong2 阅读(174) 评论(0) 推荐(0) 编辑
摘要: 本文使用HttpClient根据url进行网页下载。其中(1)HttpClient的相关知识请参见 HttpClient基础教程(2)package org.ljh.search.downloadpage;import java.io.FileNotFoundException;import jav... 阅读全文
posted @ 2014-05-19 15:07 lujinhong2 阅读(141) 评论(0) 推荐(0) 编辑
摘要: 1、HttpClient相关的重要资料官方网站:http://hc.apache.org/API:http://hc.apache.org/httpcomponents-client-4.3.x/httpclient/apidocs/index.htmltutorial:http://hc.apac... 阅读全文
posted @ 2014-05-18 23:23 lujinhong2 阅读(128) 评论(0) 推荐(0) 编辑
摘要: 转自:http://blog.csdn.net/hguisu/article/details/7949844通用搜索引擎的处理对象是互联网网页,目前网页数量以百亿计,搜索引擎的网络爬虫能够高效地将海量的网页数据传下载到本地,在本地 形成互联网网页的镜像备份。它是搜索引擎系统中很关键也很基础的构件。1. 网络爬虫本质就是浏览器http请求。 浏览器和网络爬虫是两种不同的网络客户端,都以... 阅读全文
posted @ 2014-05-16 14:10 lujinhong2 阅读(126) 评论(0) 推荐(0) 编辑
摘要: 转自:http://blog.csdn.net/hguisu/article/details/79559851. 搜索引擎的分类搜索引擎按其工作方式主要可分为三种:分别是全文搜索引擎(Full Text Search Engine)目录索引类搜索引擎(Search Index/Directory)元搜索引擎(Meta Search Engine)。 ■ 全文搜索引擎 全文搜索引擎是名副其... 阅读全文
posted @ 2014-05-16 14:08 lujinhong2 阅读(188) 评论(0) 推荐(0) 编辑
摘要: google提供了天气的api,以广州天气为例,地址为:http://api.openweathermap.org/data/2.5/weather?q=guangzhou返回的结果为:{ "coord": { "lon": 113.25, "lat": 23.12 }, "sys... 阅读全文
posted @ 2014-05-14 16:35 lujinhong2 阅读(142) 评论(0) 推荐(0) 编辑
摘要: java中用于解释json的主流工具有org.json、json-lib与gson,本文介绍org.json的应用。官方文档:http://www.json.org/java/http://developer.android.com/reference/org/json/package-summar... 阅读全文
posted @ 2014-05-14 11:25 lujinhong2 阅读(189) 评论(0) 推荐(0) 编辑
摘要: 参考自《大型网站技术架构》第1~3章1、大型网站架构演化发展历程(1)初始阶段的网站架构:一台服务器分别作为应用、数据、文件服务器(2)应用服务和数据服务分离:三台服务器分别承担上述三项工作,其中应用服务器要求CPU强大、数据库服务器需求更快的硬盘和内存,文件服务器需要较大的硬盘。(3)使用缓存改善... 阅读全文
posted @ 2014-05-07 20:40 lujinhong2 阅读(129) 评论(0) 推荐(0) 编辑
摘要: http://blog.csdn.net/stefyue/article/details/6918542为什么要做这个整合呢?当然,首先想到是就是Apache和Tomcat的区别。正因为有区别,有各自的优缺点才需要整合,取二者所长,弃二者所短。Apache和Tomcat都可以在他们的官网下载:htt... 阅读全文
posted @ 2014-05-07 15:08 lujinhong2 阅读(94) 评论(0) 推荐(0) 编辑
摘要: 1、概述Servlet API中共有5个包,约113个接口和类:javax.servletjavax.servlet.httpjavax.servlet.jspjavax.servlet.annotationjavax.servlet.descriptor2、Servlet接口(1)所有Servlet/JSP应用必须直接或者间接实现Servlet接口, Servlet/JSP容器会将实现... 阅读全文
posted @ 2014-05-05 11:19 lujinhong2 阅读(176) 评论(0) 推荐(0) 编辑
摘要: 详细代码请参见https://github.com/lujinhong/dao一、前期准备1、创建数据库create database filter_conf;2、创建表并插入数据create table T_CATEGORY(cid Int, title varchar(256), sequnce int, deleted int);insert into T_CATEGORY values(... 阅读全文
posted @ 2014-04-29 15:13 lujinhong2 阅读(176) 评论(0) 推荐(0) 编辑
摘要: http://blog.csdn.net/liguihan88/article/details/3002403无疑注释现在都被大家接受和认可,在大家编程用的IDE中都提供或有第三方插件来支持提取注释内容实现快速了解结构的功能。但在数据库的脚本编写方面我也是经历了百般折磨后总结了一些东西发来与大家切磋... 阅读全文
posted @ 2014-04-24 15:30 lujinhong2 阅读(183) 评论(0) 推荐(0) 编辑
摘要: 参考:http://blog.csdn.net/wo519074786/article/details/7697967Thetypejava.lang.Objectcannotberesolved.Itisindirectlyreferencedfrom required .class files当你在Eclipse引用不同版本JDK工程时会发生该问题。由于你开发环境中应用了多... 阅读全文
posted @ 2014-04-24 15:29 lujinhong2 阅读(221) 评论(0) 推荐(0) 编辑
摘要: 参考《疯狂android讲义》》730页JSON的基础请参考W3SCHOOL的教程:http://www.w3school.com.cn/json/index.asp例子:http://wenku.baidu.com/link?url=A5SiKBUNVx-aB_hFiDuHsEN1uw_Vu4a9... 阅读全文
posted @ 2014-04-23 16:20 lujinhong2 阅读(145) 评论(0) 推荐(0) 编辑
摘要: protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout.activity_news_content); viewFlip... 阅读全文
posted @ 2014-04-18 22:54 lujinhong2 阅读(152) 评论(0) 推荐(0) 编辑
摘要: 编程是非常酷的一件事情,但是在酷炫的背后它对很多人来说还是挺难的。很多人在学习编程之初就被困难击败了。当你不熟悉编程的时候,你可能会觉得无从下手,并且不知道如何运用学到的知识。只要你通过了这一困难的学习阶段,你就会发现一个全新的世界。 以下是一些能够帮助你快速提高编程技巧的建议。 1. 多写代码... 阅读全文
posted @ 2014-04-12 10:41 lujinhong2 阅读(118) 评论(0) 推荐(0) 编辑
摘要: (1)下载Oracle的JDBC驱动,一般放在$ORACLE_HOME/jdbc/lib目录,关于驱动的版本请见:http://elf8848.iteye.com/blog/811037随Oracle 11.1发布的Oracle JDBC驱动11.1版本ojdbc5.jar: 适用于jdk5ojdbc6.jar: 适用于jdk6 (如果你使用jdk1.5,就不能使用这个驱动)***... 阅读全文
posted @ 2014-02-19 14:49 lujinhong2 阅读(112) 评论(0) 推荐(0) 编辑
摘要: 1、数据导出基础(1)创建datapump导出文件的目录对象并为相应用户授予权限。出于安全考虑,不允许oracle用户直接在OS上进行文件的操作,而应通过directory对象指定。SQL> create directory dpump_dir1 AS '/opt/oracle/admin/orcl... 阅读全文
posted @ 2014-02-17 16:11 lujinhong2 阅读(238) 评论(0) 推荐(0) 编辑
摘要: 代码请见SimpleAdapterDemo.zip。步骤如下:1、创建主布局文件 2、创建每个列表选项的视图 3、创建主类package com.ljh.listviewdemo;import java.util.ArrayList;... 阅读全文
posted @ 2013-11-20 10:04 lujinhong2 阅读(128) 评论(0) 推荐(0) 编辑
摘要: 见归档项目ListViewDemo.zip.基本步骤如下:1、创建主布局文件,里面包含一个ListView元素。 2、创建一个TextView,用于指定每一个选项的格式3、创建主类:package com.ljh.listviewdemo;import android.os.Bundle... 阅读全文
posted @ 2013-11-19 22:35 lujinhong2 阅读(137) 评论(0) 推荐(0) 编辑
摘要: 见归档项目ListActivityDemo.zip。基本步骤如下:1、创建一个TextView,用于指定每一个ListView的格式2、创建主类package com.ljh.listactivitydemo;import android.app.ListActivity;import androi... 阅读全文
posted @ 2013-11-19 22:01 lujinhong2 阅读(106) 评论(0) 推荐(0) 编辑
摘要: 参考《疯狂android讲义》2.5节1、AdapterView一般用于显示列表项,其内容由Adapter提供。调用Adapter的setAdapter(Adapter)方法设置Adapter即可。AdapterView继承自ViewGroup,它的本质是容器。2、几个重点类的继承关系(1)Adap... 阅读全文
posted @ 2013-11-19 21:26 lujinhong2 阅读(119) 评论(0) 推荐(0) 编辑
摘要: 1、低版本API对Fragment的支持Fragment必须被加载进Acitivity中,才能呈现。而在低于3.0版本的API中,由于不存在Fragment,因此必须使用support包:(1)对于1.6(API=4)及以上版本:创建Fragment时,应该继承android.support.v4.... 阅读全文
posted @ 2013-11-18 14:15 lujinhong2 阅读(115) 评论(0) 推荐(0) 编辑
摘要: 参考APIDEMO:sdk\samples\android-19\content\LoaderCursor1、创建主布局文件,里面只包含一个Fragment。 2、创建主Activity文件中的android:name加载相应的Fragmentpackage com.example.andro... 阅读全文
posted @ 2013-11-16 10:50 lujinhong2 阅读(121) 评论(0) 推荐(0) 编辑
摘要: 参考APIDEMO及http://developer.android.com/guide/components/loaders.html#app1、Introduced in Android 3.0, loaders make it easy to asynchronously load data ... 阅读全文
posted @ 2013-11-16 10:29 lujinhong2 阅读(149) 评论(0) 推荐(0) 编辑
摘要: Fragment一个重要的作用在于根据屏幕的尺寸或者方向加载不同的布局。未完待续 版权声明:本文为博主原创文章,未经博主允许不得转载。 阅读全文
posted @ 2013-11-15 21:37 lujinhong2 阅读(114) 评论(0) 推荐(0) 编辑
摘要: 参考自张泽华视频Fragment是自Android3.0后引入的特性,主要用于在不同的屏幕尺寸中展现不同的内容。Fragment必须被嵌入Activity中使用,总是作为Activity的组成部分。简单示例:一个Activity的界面由2个部分组成,每个部分分别是一个Fragment。效果图如下:1... 阅读全文
posted @ 2013-11-15 18:16 lujinhong2 阅读(122) 评论(0) 推荐(0) 编辑
摘要: 1、下载相应的包及项目,参考https://github.com/github/android/wiki/Building-From-Eclipse。2、若需查看某些包的源文件或者javadoc,则(以org.eclipse.egit.github.core-2.1.5.jar为例)(1)下载其源代... 阅读全文
posted @ 2013-11-12 22:47 lujinhong2 阅读(102) 评论(0) 推荐(0) 编辑
摘要: http://my.eoe.cn/futurexiong/archive/181.html开发第三方Android应用的,大多数人应该还是Eclipse结合ADT来开发。那么大多数时候我们可能希望点击API提供的一个类或者一个方法或者一个变量,从而进入API相关的源码中进行查看,用于Debug或者就... 阅读全文
posted @ 2013-11-12 22:32 lujinhong2 阅读(141) 评论(0) 推荐(0) 编辑