代码改变世界

搜索结果点击情况 进行加权

2012-07-18 23:46 by yuejianjun, 326 阅读, 0 推荐, 收藏, 编辑
摘要:在垂直列表显示的每页搜索结果中:i显示排名 P,当页点击条目数 D未点击加权:这每条加权为W(i)=(P-D)<0?(1/(D-P)):1点击加权:这每条加权为W(i)=(P-D)<0?(P-D)+1:2最后对W(i) 开根号或者log等 加权到搜索权重中去 阅读全文

java httpURL连接远程服务器并返回数据(httpurlconnection)(转)

2012-06-29 15:41 by yuejianjun, 544 阅读, 0 推荐, 收藏, 编辑
摘要:Java发送http请求 (get与 post方法请求),以下代码经本人亲自调试可用!可以直接使用之。注意:通过BufferedReader 读取远程返回的数据时,必须设置读取编码,否则中文会乱码!package com.jiucool.www.struts.action; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.File; import java.io.FileReader; import java.io.IOException; import java.io.InputS. 阅读全文

实体类 topN

2012-06-26 16:22 by yuejianjun, 191 阅读, 0 推荐, 收藏, 编辑
摘要:ObjectScore[] obj = ObjectScoreArray.GetObjectScoreArray();ScoreSort.TopSort(obj, 5, new ObjectScoreComparer());obj 前5个最小using System;using System.Collections.Generic;using System.Linq;using System.Text;namespace Test{ class ScoreSort { public static void TopSort(ObjectScore[] array, int top, O... 阅读全文

topN 堆排序 (int 类型)

2012-06-26 15:00 by yuejianjun, 420 阅读, 0 推荐, 收藏, 编辑
摘要:using System;using System.Collections.Generic;using System.Linq;using System.Text;using System.Diagnostics;namespace Test{ class Program { static void Main(string[] args) { List<int> testValues = new List<int>(); Random rand = new Random(); int count = 100; for (int i = ... 阅读全文

过滤词

2012-05-10 21:02 by yuejianjun, 220 阅读, 0 推荐, 收藏, 编辑
摘要:<?xml version="1.0" encoding="GB2312"?>-<wordList> <word>,</word> <word>.</word> <word><</word> <word>></word> <word>?</word> <word>/</word> <word>\</word> <word>|</word 阅读全文

Lucene的评分(score)

2012-05-09 14:14 by yuejianjun, 444 阅读, 0 推荐, 收藏, 编辑
摘要:在Lucene中score简单说是由 tf * idf * boost * lengthNorm*coord(q,d)计算得出的。 tf:是查询的词在文档中出现的次数的平方根 idf:表示反转文档频率,观察了一下所有的文档都一样,所以那就没什么用处,不会起什么决定作用。Term t在几篇文档中出现过,对于一个特定的搜索词,该值是一个定值,对所有文档都一样,就不会影响打分。 boost:激励因子,可以通过setBoost方法设置,需要说明的通过field和doc都可以设置,所设置的值会同时起作用 lengthNorm:是由搜索的field的长度决定了,越长文档的分值越低。lengthNor... 阅读全文

位图求交集

2012-04-26 23:00 by yuejianjun, 426 阅读, 0 推荐, 收藏, 编辑
摘要:位图求交集View Codepublicclass位图求交集{///<summary>///排序数组///</summary>///<paramname="list">排序数组</param>///<paramname="MaxNumber"></param>///<returns></returns>publicstaticList<int>BitList(List<List<int>>list){intcount=lis 阅读全文

位运算包含功能

2012-03-21 21:14 by yuejianjun, 449 阅读, 0 推荐, 收藏, 编辑
摘要:publicclass位运算包含功能{publicstaticvoidIsContains(){intintSubClassID=0;intintClassid=0;int[]main=newint[]{3,5,7,8,9};for(inti=0;i<main.Length;i++){intClassid=1<<main[i];intSubClassID|=intClassid;}intqa=25;qa=GetBit(qa);if((intSubClassID&qa)!=qa){///不包含Console.WriteLine("不包含");}els 阅读全文

页面抓取匹配时,万恶的\r,\n,\t 要先替换掉为空,出现匹配有问题,都是这个引起的

2011-12-03 00:04 by yuejianjun, 340 阅读, 0 推荐, 收藏, 编辑
摘要:页面抓取匹配时,万恶的\r,\n,\t 要先替换掉为空,出现匹配有问题,都是这个引起的 阅读全文

探索推荐引擎内部的秘密,第 1 部分: 推荐引擎初探

2011-12-01 23:34 by yuejianjun, 258 阅读, 0 推荐, 收藏, 编辑
摘要:http://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy1/index.html赵 晨婷, 软件工程师, IBM马 春娥, 软件工程师, IBM简介: 随着 Web 技术的发展,使得内容的创建和分享变得越来越容易。每天都有大量的图片、博客、视频发布到网上。信息的极度爆炸使得人们找到他们需要的信息将变得越来越难。传统的搜索技术是一个相对简单的帮助人们找到信息的工具,也广泛的被人们所使用,但搜索引擎并不能完全满足用户对信息发现的需求,原因一是用户很难用恰当的关键词描述自己的需求,二是基于关键词的信息检索在很多情况下是不够的。而 阅读全文