摘要: 大家可能听说过,Google 革命性的发明是它名为 “Page Rank” 的网页排名算法,这项技术彻底解决了搜索结果排序的问题。其实最先试图给互联网上的众多网站排序的并不是 Google。Yahoo! 公司最初第一个用目录分类的方式让用户通过互联网检索信息,但由于当时计算机容量和速度的限制,当时的 Yahoo! 和同时代的其它搜索引擎都存在一个共同的问题: 收录的网页太少... 阅读全文
posted @ 2010-10-03 18:27 ForA 阅读(239) 评论(0) 推荐(0) 编辑
摘要: 0. 缺乏数据(Lack Data)1. 太关注训练(Focus on Training)2. 只依赖一项技术(Rely on One Technique)3. 提错了问题(Ask the Wrong Question)4. 只靠数据来说话(Listen (only) to the Data)5. 使用了未来的信息(Accept Leaks from the Future)6. 抛弃了不该忽略的案... 阅读全文
posted @ 2010-10-03 17:30 ForA 阅读(221) 评论(0) 推荐(0) 编辑
摘要: 应该如何完整地理解"数据挖掘"?"数据挖掘"的理论基础是什么?  图1表示的是:  现实中人类的社会和经济活动,总可以用数据(数字或者符号)来描述和记录;经过对这些数据的分析,就会产生信息(知识);用这些信息(知识)来指导实践,就可以做出相应的决策;这些决策又引发了新一轮的社会和经济活动。循环往复,生息不止。  那么数据仓库(DW)、商务智能(BI)和知识发现(KDD)又分别是什么呢?  图2中的... 阅读全文
posted @ 2010-10-03 17:27 ForA 阅读(1191) 评论(1) 推荐(1) 编辑
摘要: 数据挖掘是从数据集中识别出有效的、新颖的、潜在并有用的、最终可理解的模式的非平凡过程。它综合使用统计分析、数据仓库、人工智能、信息科学等多个学科的技术,从海量的客户数据中找出传统经营分析方法难以洞察的客户行为模式,给出客户的详细描述,并可以有效预测客户的行为倾向。目前,数据挖掘在电信运营企业中的应用越来越广。但随着应用的深入,偏差和误区也频繁出现,包括操作、流程、思路、方法、工具等。笔者试图从经典... 阅读全文
posted @ 2010-10-03 17:24 ForA 阅读(374) 评论(0) 推荐(0) 编辑
摘要: 什么样是人性化的服务?    想听一首歌,不必想好其歌名,到搜索引擎里去搜索、下载;而是输入现在的心情,比如“激昂”,播放器就自动播放出《男儿当自强》这样的歌曲,而且一首接着一首。    想去旅游,不必苦思要去什么具体的城市,而是输入大概想法,比如“浪漫的周末度假”,就能马上看到十个建议:包括一家临海宾馆的情侣房、烛光晚餐、一套在周五晚起飞周日晚返归... 阅读全文
posted @ 2010-10-03 17:01 ForA 阅读(450) 评论(0) 推荐(0) 编辑
摘要: 为什么我们要说倒排索引呢? 因为倒排索引是目前 搜索引擎公司最对搜索引擎最常用的存储方式.也是搜索引擎的核心内容!在搜索引擎实际的引用之中,有时需要按照关键字的某些值查找记录,所以我们是按照关键字建立索引,这个索引我们就称之为: 倒排索引, 而带有倒排索引的文件我们又称作: 倒排索引文件 也可以叫它为: 倒排文件 来实现快速的检索与高速的效率!那我想问下 什么是倒排表呢? 倒排文件中的 次关键字索... 阅读全文
posted @ 2010-06-12 09:29 ForA 阅读(6969) 评论(0) 推荐(2) 编辑
摘要: 如何将百度作为自己网站的搜索引擎,以百度新闻为例。解决方案:读取页面+正则表达式百度新闻搜索糖尿病,搜索出的内容查看源文件,知结果的每一项以如下格式呈现(这里是两条数据):<table cellspacing=0 cellpadding=2><tr><td class="text"><a href="http://news.163.com/10/0612/... 阅读全文
posted @ 2010-06-12 09:01 ForA 阅读(587) 评论(0) 推荐(0) 编辑
摘要: tooltip.jsp文件:代码 Code highlighting produced by Actipro CodeHighlighter (freeware)http://www.CodeHighlighter.com/--<%@pagelanguage="java"contentType="text/html;charset=utf-8"pageEncoding="utf-8"%&g... 阅读全文
posted @ 2010-05-25 17:11 ForA 阅读(380) 评论(0) 推荐(0) 编辑
摘要: 解决方案:url中传值,设置Firefox的参数传递编码:url = "tooltipDisplayAction.te?key=" + encodeURIComponent(key); 即是encodeURIComponent在Struts的action中添加接受数据的参数设置:request.setCharacterEncoding("UTF-8"); response.setHeader("C... 阅读全文
posted @ 2010-05-21 09:39 ForA 阅读(896) 评论(0) 推荐(0) 编辑
摘要: JForum发布步骤环境搭建:TOMCAT + MYSQL 安装部署 1、去http://www.jforum.net/download.jsp网站下载jforum的发布包。 2、安装mysql数据库。为了解决论坛出现的中文乱码问题,可以通过手动修改配置文件或者在安装mysql时设置编码为utf8, 可以避免页面中显示乱码。安装好mysql后,进入>mysql状态输入:CREATE DATA... 阅读全文
posted @ 2010-04-23 17:35 ForA 阅读(3873) 评论(1) 推荐(0) 编辑