上一页 1 2 3 4 5 6 ··· 9 下一页
摘要: 传统的count-base representation有什么问题呢,可以看下图 观察句式2,其对应的向量中he所在位置的元素值是2,因为he在原句中出现了2次。可是,he在这一句中,并不算是关键词,事实上,denied和lied才是句子2的关键词,但是他们只出现了一次,所以在向量中对应位置的元素值 阅读全文
posted @ 2020-09-21 01:12 地球上最后一个直男 阅读(335) 评论(0) 推荐(0) 编辑
摘要: 欧氏距离:如下图所示,欧氏距离越小,表示句子之间相似度越高 余弦相似度:如下图,余弦相似度越大,代表相似度越高。欧氏距离么有考虑向量的方向这一大要素,所以余弦相似度更贴切一些。 阅读全文
posted @ 2020-09-21 00:59 地球上最后一个直男 阅读(263) 评论(0) 推荐(0) 编辑
摘要: 词的one-hot表示 下面直接举例吧 现在假设我们有一个词典库【“我们”,“去”,“爬山”,“今天”,“你们”,“昨天”,“跑步”】,对于“我们”这个词,可以用这么一个向量表示,向量的维度是词典库的长度,这个向量的元素是0和1。由于“我们”在词典中是第一个位置,所以对应的向量第一个元素是1,其他位 阅读全文
posted @ 2020-09-20 22:19 地球上最后一个直男 阅读(1528) 评论(0) 推荐(0) 编辑
摘要: 对于nlp的应用,我们应该先把停用词以及出现频率很低的词汇给过滤掉 在英文里,比如'the','and','their'都可以作为停用词来处理,但是,也要考虑自己的使用场景。例如,在中文中,“好”,“很好”这些词汇在有些应用中可以作为停用词过滤掉。但是如果是情感分析,这些词不能被过滤,也不能当作停用 阅读全文
posted @ 2020-09-19 21:26 地球上最后一个直男 阅读(1371) 评论(0) 推荐(0) 编辑
摘要: 一.编辑距离 关于编辑距离,在我的博客https://www.cnblogs.com/loubin/p/13672786.html中已经详细的介绍了。简短的说就是把一个单词修改成另一个单词需要的修改次数。当然,每一次只能增加一个字符,删除一个字符,或者更换一个字符。例如,apple和apply的编辑 阅读全文
posted @ 2020-09-18 18:29 地球上最后一个直男 阅读(246) 评论(0) 推荐(0) 编辑
摘要: 一:分词 常用的分词工具有jieba分词,snowNLP,LTP,HanNLP 1.前向最大匹配算法 现在假设我们有一个词典库{‘这些’,“这些年”,‘年’,‘的’, ‘情’,‘与’,‘爱’,‘终究’,‘是’, ‘错’,‘错付’,‘了’, ‘甄嬛’,。。。} 我们对“这些年的情与爱终究是错付了”利用 阅读全文
posted @ 2020-09-16 18:35 地球上最后一个直男 阅读(371) 评论(0) 推荐(0) 编辑
摘要: 一:分词 常用的分词工具有jieba分词,snowNLP,LTP,HanNLP 1.前向最大匹配算法 现在假设我们有一个词典库{‘这些’,“这些年”,‘年’,‘的’, ‘情’,‘与’,‘爱’,‘终究’,‘是’, ‘错’,‘错付’,‘了’, ‘甄嬛’,。。。} 我们对“这些年的情与爱终究是错付了”利用 阅读全文
posted @ 2020-09-15 22:01 地球上最后一个直男 阅读(393) 评论(0) 推荐(0) 编辑
摘要: 主定理的内容: 主定理主要用于解决如下表示形式的算法的时间复杂度: 其中a≥1,b>1,且a,b都是常数,f(n)是一个渐进正函数 有如下三种情况: 下面是一些练习题,可以没事做做 下面是解答: 阅读全文
posted @ 2020-09-15 14:59 地球上最后一个直男 阅读(171) 评论(0) 推荐(0) 编辑
摘要: 原文出处:https://algorithms.tutorialhorizon.com/dynamic-programming-edit-distance-problem/ 问题:假设我们现在有两个字符串s1和s2,并且给出如下所示的三个编辑操作,写出一个算法,当每次只能使用其中一个编辑操作时,找到 阅读全文
posted @ 2020-09-15 14:14 地球上最后一个直男 阅读(185) 评论(0) 推荐(0) 编辑
摘要: 直接转载大神的:https://www.jianshu.com/p/f4cca5ce055a 数据结构408的最爱 阅读全文
posted @ 2020-09-14 20:52 地球上最后一个直男 阅读(174) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 9 下一页