上一页 1 ··· 42 43 44 45 46 47 48 49 50 ··· 161 下一页
摘要: 1,使用indexreader创建indexsearcher. 2,indexsearcher在使用完了以后不要关闭. 3.使用indexreader.isCurrent()判断索引是否被indexwriter改动. 4,如果索引被改动,indexsearcher.close()先前那个,然后new indexsearcher(indexreader).传string给searcher,searcher会维护一个内部的reader,当本次搜索结束后reader会被关掉.如果使用reader构造,reader在本次搜索结束后不会被关掉,除非你自己调用reader.close();所以用reade 阅读全文
posted @ 2013-12-20 14:40 郑文亮 阅读(1370) 评论(0) 推荐(0) 编辑
摘要: Lucene版本:3.0一般情况下,lucene的IndexSearcher都要写成单实例,因为每次创建IndexSearcher对象的时候,它都需要把索引文件加载进来,如果访问量比较大,而索引也比较大,那就很容易造成内存溢出!但是如果仅仅按照一般的单实例来写的话,如果更新了索引,那么在不重启服务的情况下,Searcher对象是搜索不到索引更新后的内容的.如何解决呢,这里给出一个方法!在这个方法里,建造了一个Factory类,分别管理IndexReader和IndexSearcher的单实例.import java.io.File; import java.io.IOException; .. 阅读全文
posted @ 2013-12-20 14:21 郑文亮 阅读(2626) 评论(0) 推荐(0) 编辑
摘要: 例子:public static void getUserRFM(DateTime beginTime, DateTime endTime) { MongoDatabase mongoDB = getConnection(); //会员消费明细的实体类 List shopplist = new List(); //获得Ky_shopplist集合 MongoCollection col = mongoDB.GetCollection("Ky_Shopplist"); //获得Ky_UserRFM的集合 MongoCollection colRFM = mongoDB.Get 阅读全文
posted @ 2013-12-19 14:23 郑文亮 阅读(2977) 评论(0) 推荐(0) 编辑
摘要: 作者:eaglet 盘古分词开发了多元分词算法,其与lucene.net 配合构建全文搜索,经测试准确度接近google和baidu的水平。现将一些实现方法和测试结果公布出来,供关心分词和搜索技术的朋友们参考。 中文分词按照分词粒度来分,分成 一元分词,二元分词,多元分词和精确分词等类型。一元分词就是最简单的分词,将所有的中文字符按照单字形式输出。二元分词按双字形式输出。多元分词则是将 一句话中可能的单词组合按照一定规则输出,允许输出的词有重叠。精确分词则是将一句话中最准确的单词组合输出,不允许输出的词有重叠。当然这里用精确这个 词来修饰只是为了与其他几种分词方法区分,不可能有完全精确的分.. 阅读全文
posted @ 2013-12-03 17:23 郑文亮 阅读(1384) 评论(0) 推荐(0) 编辑
摘要: 在某些软件下载网站的全文搜索应用中往往需要根据部分或者全部的版本号来匹配查询。然而对于版本信息的提取,无论是采用增加单词还是其他什么办法都 无法很好的实现。好在盘古分词提供了自定义规则的接口,我们可以通过实现自己的自定义规则来完成一些特殊信息的提取。这篇文章也作为盘古分词自定义规则使 用的一个示例文章,希望大家看了这篇文章后可以举一反三,实现诸如IP地址提取,Email 提取,网址提取等等特殊提取功能的自定义规则。首先先说一下需求。我们希望将版本信息字符串 比如 V1.2.1.0 从文章中提取出来,分词为 v/1.2.1.0/1.2.1/1.2 这种形式,这样无论搜索用户输入 1.2.1.0 阅读全文
posted @ 2013-12-03 16:39 郑文亮 阅读(554) 评论(0) 推荐(0) 编辑
摘要: 雅虎NCP是什么,NCP能做什么,为什么NCP能够成为网络黄页的终结者。NCP在颠覆既有市场格局的同时,其真实目的时什么?是成为网络化操作系统还是图谋最大化长尾广告。笔者相信,过不了多久,市场将会告诉我们答案。 我们先从雅虎NCP和黄页的定义说起: 黄页:黄页是工商企业、各类事业单位的电话号码簿,以刊登企业名称、地址、电话号码为主体内容。最早的工商企业电话号码簿印在黄色的纸上,故称黄页。现在流行的企业名录、工商指南、消费指南等,也可以算是黄页的各种表现形式;黄页可以印刷品、光盘、互联网等多种形式向公众发布及出版。网络黄页和黄页本质上没什么不同,只不过传播的介质从纸张和光盘变成了比特流,但通.. 阅读全文
posted @ 2013-12-02 20:32 郑文亮 阅读(1136) 评论(0) 推荐(0) 编辑
摘要: 深凹的颧骨,扭曲的头发,淘气的露齿笑,一个5英尺高、100磅重的顽童模样。” 2000年7月17日,马云成为第一个登上《福布斯》封面的大陆企业家。从创办中国黄页到掌舵阿里巴巴,马云用梦想、承诺与坚持串起了自己的创业史。马云自喻为“一个骑在盲虎身上的盲人”,抱着根本不明白将来会怎么样的心态,他已挺过一个个创业的艰难时刻。 2000年7月,马云“登上”福布斯杂志封面 “骗子”马云与中国黄页 许多成功者的第一个创业项目都与后来真正做大的主业并不一致,马云也是如此。1991年,马云成立海博(英文“hope”的音译)翻译社,结果第一个月收入700元,房租2000元。军心动摇之际,马云独自背起大麻袋... 阅读全文
posted @ 2013-12-02 15:35 郑文亮 阅读(1240) 评论(0) 推荐(0) 编辑
摘要: 随着企业黄页的慢慢发展,以及伴随着互联网,电子商务行业的兴趣,传统的企业黄页渐渐的向网络企业黄页,移动企业黄页等新型企业黄页的的趋势发展。这种新型的企业黄页,是以传统的企业黄页为基础,把传统黄页搬到互联网,手机等移动设备上,利用互联网,手机等移动设备为载体,发行、传播、应用的电话号码簿,类似于百度、谷歌的搜索引擎,只是这种搜索引擎是在手机本机实现的,随时随地拿起手机,便可轻松查询企业的基本信息和企业简介或服务介绍。 加入企业黄页有什么好处? 一大把企业黄页库,提供全面详实的中小企业信息。是中国中小企业展示自我的优秀平台,是商人买卖产品、拓展市场及网络推广的首选。加入一大把中小企业信息库,即可免 阅读全文
posted @ 2013-12-02 14:51 郑文亮 阅读(994) 评论(0) 推荐(0) 编辑
摘要: 华大黄页信息有限公司是一家为客户提供全方位、专业的商业分类信息及市场推广服务的信息服务公司。公司于1997年底在香港成立,并推出第一家服务于国内企业的专业网上黄页网站。目录1网站发展2企业文化3公司荣誉4发展事记网站发展 随着公司业务的不断发展,同时也为了更好的服务于国内企业,公司于1999年成立了联通黄页信息有限公司,在深圳出版的《联通黄页》是中国第一本国际版本的指引性分类广告媒体。8年来,先后又在广州、上海、东莞、惠州、佛山、厦门、无锡、常州等热点城市出版了完全按照国际黄页标准模式制作的黄页产品,并已在各地取得了稳健地发展。 中华大黄页网站和《联通黄页》印刷版以实用的资讯信息、丰富的数.. 阅读全文
posted @ 2013-12-02 14:49 郑文亮 阅读(2923) 评论(0) 推荐(0) 编辑
摘要: 中国114黄页的核心价值观 以客为尊、以人为本、团队协作、卓越创新 中国114黄页的愿景 把中国114建设成为中国最大最具有市场影响力的电子商务门户,使每一个中小企业和商家都有能在网上做意。 中国114黄页的使命 提供安全、快捷、简单的电子商务,为客户创造更多的价值。 中国114黄页的三大理念 经营理念,人才理念,服务理念 中国黄页114的最大亮点 一、推广 只需在我们公司做网站,不用花推广的钱,就能达到做推广的效果,即让其他想购买贵公司产品的客户以最快的速度找到您,并进行交易,又能节省高额的推广费用,不是很划算吗? 二、模式 在其它公司做网站时都有空间限制,比如:我们的... 阅读全文
posted @ 2013-12-02 14:40 郑文亮 阅读(778) 评论(0) 推荐(0) 编辑
上一页 1 ··· 42 43 44 45 46 47 48 49 50 ··· 161 下一页