上一页 1 2 3 4 5 6 7 8 9 10 ··· 12 下一页
摘要: 今天的工作是完成把之前建立的倒排索引和数据库搜索匹配模块嵌入到主体工程中,等待运行和测试。 但是,现在的数据库搜索方法精度还不够,天真把每个关键词一视同仁地处理了,这样的后果可能回造成用户搜索体验不佳。为此我查询了一下影响相关性的主要因素相关资料: (1)关键词常用程度。经过分词后的多个关键词,对整个搜索字符串的意义贡献并不相同。越常用的词对搜索词的意义贡献越小,越不常用的词对搜索词的意义贡献越大。例如,用户输入的搜索词是“我们冥王星”。“我们”这个词常用程度非常高,在很多页面上会出现,它对“我们冥王星”这个搜索词的辨识程度和意义相关度贡献就很小。找出那些包含“我们”这个词的页面,对搜... 阅读全文
posted @ 2012-11-09 21:49 DOOM_buaascse 阅读(210) 评论(2) 推荐(0) 编辑
摘要: PS:这本是属于昨晚的帖子,对不住忠仔。现在补上。 忠仔,终于交给了我一个实实在在的任务,很是欣喜,也很是忐忑,生怕自己不能及时完成任务。 好了,废话不多说,步入正题。 接下任务【画出UML类图和用例图】之后,开始有点无头苍蝇之感,于是就把队友之前写的工作进度日志重新翻看并做了一遍统计(见段落下方图片),但是多多少少还是有点没有头绪。当然,在此过程中,电脑的D盘中多了一个叫StarUML的东东~ 后来我就又去找忠仔明确了任务着手方向,原来按照高工组设计的网站的主页和查询界面,写出用例图(类图)就好了。 如此方向确定下来,一切便拨开云雾见月明。 大致浏览了网页... 阅读全文
posted @ 2012-11-09 01:11 DOOM_buaascse 阅读(287) 评论(1) 推荐(0) 编辑
摘要: 这几天不知道怎么的,项目一直进展缓慢,心里有些着急,下面是几个总结:(1)数据库来的时候,我们的能否承受大数据的考验;(2)组员这几天都有些闲,不知道方向是怎么样的,这可能是我PM的失职吧;今天我们的工作量基本等于零,很无奈,项目的工作有些方向问题,主要问题是和其它小组沟通不够;下面说一下明天的工做:(1)陈伯雄:建立暂存搜索结果的基本表在数据库;(2)潘学:在数据库里建立最流行资源的基本表;(3)刘宇翔和李忠:把展示页面的功能填满;(4)苏若:match部分大数据量处理的实现要的技术学习,后天改进match 阅读全文
posted @ 2012-11-08 23:50 DOOM_buaascse 阅读(203) 评论(0) 推荐(0) 编辑
摘要: 今天其实也没有干什么事,就是对自己做得项目进行整理和测试。整体代码如下:DownloadContent.aspx.cs:using System;using System.Collections.Generic;using System.Linq;using System.Web;using System.Web.UI;using System.Web.UI.WebControls;public partial class DOOM_DownloadContent : System.Web.UI.Page{ private string myintegration; private strin 阅读全文
posted @ 2012-11-07 23:59 DOOM_buaascse 阅读(189) 评论(0) 推荐(0) 编辑
摘要: 修改了模糊匹配的算法。增加了低匹配程度的精确度。修正了一些因算法变动产生的bug。至此match算法基本完成。之后将其应用到search算法中,并一起参加search算法的改进。using System;using System.Collections.Generic;using System.Linq;using System.Text;using System.Threading.Tasks;using System.IO;namespace match0{ class Program { static public int match(string word,s... 阅读全文
posted @ 2012-11-07 23:49 DOOM_buaascse 阅读(220) 评论(0) 推荐(0) 编辑
摘要: 今天进展缓慢,没有什么实质性的进展、所有的组员都好像没有什么其他的事情可干了,就差加入数据库的操作(比如用户积分的操作、数据库里读出文档)了,似乎项目就要完成了,明天就能将各个模块组合起来,我们小组的部分就已经完成编码阶段了,后天和大后天就进入测试阶段,由于项目的主要内容是SearchOfThisSite,这就成了测试重点了,我们将尽量找多一些数据来测试我们部分。今天我花了一下午时间把我们最终的网页界面弄出来,明天就是填充各个功能了。下面是我设计的最终界面的样式:主页面:搜索结果界面: 阅读全文
posted @ 2012-11-07 23:45 DOOM_buaascse 阅读(171) 评论(0) 推荐(0) 编辑
摘要: 今天针对PIPE组对数据表的修改,对建立倒排索引做了系统的修改,由于表DOC、VEDIO、QUESTION(由QAPAIR修改为QUESTION)的属性并不完全相同,处理数据方法进行少量修改: DOC表和VEDIO表具有的相同属性:title; DOC独有属性:author,keywords; QUESTION独有属性:question; 3个表最后的到的倒排索引结构式相同的,得到WORDLIST和对应ID; 以下功能整合到分词模块和更新倒排索引模块中//分词 static private List<string> getWords(int type, SqlDat... 阅读全文
posted @ 2012-11-07 23:36 DOOM_buaascse 阅读(239) 评论(0) 推荐(0) 编辑
摘要: protected void Page_Load(object sender, EventArgs e) { }//初始化页面 protected void OK_Click(object sender, EventArgs e) //点击上传时 { title = Title.Text; keyWord = Keyword.Text; author = Author.Text; fileaddress = MapPath(fu.FileName); filetyp... 阅读全文
posted @ 2012-11-07 22:00 DOOM_buaascse 阅读(245) 评论(0) 推荐(0) 编辑
摘要: 到目前为止,各个功能模块的基本已经实现(match仍是测试重点),并且第二大组(数据处理大组)的数据库建的表的模式已经给我们了。现在要对所有工作进行整理了,往我们的主页面和搜索结果页面添加功能实现,目前需要做的工作是:(1)在第二大组的数据库里建一个存储访问量最大的那些资源的表,供主页面使用(2)建一个存储倒排表的基本表,供搜索页面使用(3)把先前测试用的代码加入到主页面和搜索结果页面对应的功能模块 阅读全文
posted @ 2012-11-07 14:30 DOOM_buaascse 阅读(221) 评论(0) 推荐(0) 编辑
摘要: 今天,我就做了几件事。首先是修复以一个BUG,以前写的代码,用户即使没有点击弹窗里面的确定按钮,也会被扣积分。我在确定按钮时间里面,有一个变量会标记用户是否下载过,如果已经有过下载记录,那么就不扣积分,这样的话,这个BUG没有给用户返回的机会。之后,组长更改积分方式,改为每次都要积分,那么这个BUG是致命的。这在已经把更改积分的函数,写在了确定按钮的事件里了 阅读全文
posted @ 2012-11-06 23:56 DOOM_buaascse 阅读(219) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 10 ··· 12 下一页