上一页 1 ··· 19 20 21 22 23 24 25 26 27 ··· 38 下一页
  2014年12月6日
摘要: 好了,我们现在已经会怎样读入了,然后就是研究一下如何存储等一些细节上的的问题了。首先,比较函数是不能传入char*的地址的,但是可以接受一个string类。然而,如果是两个比较长的string类,要进行比较的话,时间复杂度会上升至O(min(length)),非常不合算。于是采用双哈希的办法,用h1... 阅读全文
posted @ 2014-12-06 10:41 Xs酱~ 阅读(424) 评论(1) 推荐(0) 编辑
摘要: 好吧,课题和汉语处理有关,于是就要求用c++来读入汉字进行处理。首先使用wchar_t字符即宽字符,然后这样定义: 1 #include 2 #include 3 4 using namespace std; 5 6 int main() { 7 wchar_t* ch; 8 ... 阅读全文
posted @ 2014-12-06 09:33 Xs酱~ 阅读(1279) 评论(0) 推荐(0) 编辑
  2014年12月5日
摘要: 总算是到正题上了。。。词义消歧,亦称语义消歧,是计算语言学领域的基础性关键研究课题。对于许多词语(特别是汉语词语和一部分专有名词),一个词有许多种意思。例如专有名词"卡特",我们可以找到非常出名的两种含义:1. 文斯·卡特(Vince Carter),美国职业篮球运动员2. 詹姆斯·厄尔·卡特,19... 阅读全文
posted @ 2014-12-05 22:34 Xs酱~ 阅读(5757) 评论(3) 推荐(0) 编辑
  2014年12月4日
摘要: 这里隆重推出介绍一种词义消歧的(简单)方法:句子相似度虽然第一反应一定是介个,但是总不能说他们的相似度就是单词出现的重复次数吧= =||,怎么看都觉得不科学233于是,我们想到了最简单却又好用的相似度判断方式,就是"余弦相似性"(cosine similiarity)了啦:我们现在有两句话s1和s2... 阅读全文
posted @ 2014-12-04 18:43 Xs酱~ 阅读(724) 评论(2) 推荐(0) 编辑
摘要: 首先引用百度百科的话:"TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。""TF-IDF实际上是:TF * IDF,TF词频(Term Frequency),... 阅读全文
posted @ 2014-12-04 14:39 Xs酱~ 阅读(6614) 评论(0) 推荐(0) 编辑
摘要: RT,学校课题需要233,没了话说,窝直接做个链接的集合好了,方便以后查找特征值提取之 -- TF-IDF值的简单介绍汉语语义消歧之 -- 句子相似度汉语语义消歧之 -- 词义消歧简介c++读入之 -- 汉字读入遇到的问题c++实现之 -- 汉语词语的简单处理c++实现之 -- 文章TF-IDF值的... 阅读全文
posted @ 2014-12-04 13:55 Xs酱~ 阅读(497) 评论(1) 推荐(0) 编辑
  2014年12月3日
摘要: 简单地树形DP我们用f,g表示最大、最小值,0,1,2表示颜色然后直接推递推公式请见程序233 1 /************************************************************** 2 Problem: 1864 3 User: raus... 阅读全文
posted @ 2014-12-03 21:52 Xs酱~ 阅读(261) 评论(0) 推荐(0) 编辑
  2014年12月2日
摘要: 先令n! = a:1 / x + 1 / y = 1 / a => x = y * a/ (y - a)再令k = y - a:于是x = a + a ^ 2 / k => k | a ^ 2故等价于求a ^2的约数个数素数筛一下什么的就好了嘛 1 /************************... 阅读全文
posted @ 2014-12-02 18:58 Xs酱~ 阅读(762) 评论(0) 推荐(0) 编辑
摘要: 第一次知道。。原来spfa还可以这样写。。。用pq。。。只需要直接求拐点即可,数据小想怎么搞就怎么搞(话说怎么这么裸的最短路都写不出来了233) 1 /************************************************************** 2 Probl... 阅读全文
posted @ 2014-12-02 17:18 Xs酱~ 阅读(277) 评论(0) 推荐(0) 编辑
  2014年12月1日
摘要: 首先我们链剖一下。。。然后建立n棵线段树,分别维护n个不同颜色的信息。于是MLE 233其实发现线段树并不会开满的,于是只要动态开点即可。做完了。 1 /************************************************************** 2 Pr... 阅读全文
posted @ 2014-12-01 21:26 Xs酱~ 阅读(298) 评论(0) 推荐(0) 编辑
上一页 1 ··· 19 20 21 22 23 24 25 26 27 ··· 38 下一页