摘要:
今天的工作是完成把之前建立的倒排索引和数据库搜索匹配模块嵌入到主体工程中,等待运行和测试。 但是,现在的数据库搜索方法精度还不够,天真把每个关键词一视同仁地处理了,这样的后果可能回造成用户搜索体验不佳。为此我查询了一下影响相关性的主要因素相关资料: (1)关键词常用程度。经过分词后的多个关键词,对整个搜索字符串的意义贡献并不相同。越常用的词对搜索词的意义贡献越小,越不常用的词对搜索词的意义贡献越大。例如,用户输入的搜索词是“我们冥王星”。“我们”这个词常用程度非常高,在很多页面上会出现,它对“我们冥王星”这个搜索词的辨识程度和意义相关度贡献就很小。找出那些包含“我们”这个词的页面,对搜... 阅读全文
摘要:
PS:这本是属于昨晚的帖子,对不住忠仔。现在补上。 忠仔,终于交给了我一个实实在在的任务,很是欣喜,也很是忐忑,生怕自己不能及时完成任务。 好了,废话不多说,步入正题。 接下任务【画出UML类图和用例图】之后,开始有点无头苍蝇之感,于是就把队友之前写的工作进度日志重新翻看并做了一遍统计(见段落下方图片),但是多多少少还是有点没有头绪。当然,在此过程中,电脑的D盘中多了一个叫StarUML的东东~ 后来我就又去找忠仔明确了任务着手方向,原来按照高工组设计的网站的主页和查询界面,写出用例图(类图)就好了。 如此方向确定下来,一切便拨开云雾见月明。 大致浏览了网页... 阅读全文