摘要: TF-IDF(Term Frequency-Inverse Document Frequency),是用来衡量一个词在文档中的重要性,下面看一下TDF-IDF的公式: 首先是TF,也就是词频,用来衡量一个词在文档中出现频率的指标。假设某词在文档中出现了( n )次,而文档总共包含( N )个词,则该 阅读全文
posted @ 2024-08-22 11:18 TW-NLP 阅读(106) 评论(0) 推荐(0) 编辑
摘要: 力扣的简单题目,来找单词的规律,下面我们用python的dict来解决,思路:同时遍历pattern和s,因为s是用空格进行分割的,因此用python的split() 函数进行拆分即可。 Step1:统计pattern和s的长度是否一致,不一致返回False Step2: 遍历pattern 和 s 阅读全文
posted @ 2024-08-20 16:41 TW-NLP 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 要想解答这个算法,得明白一个概念,什么是同构字符串,来看一下定义: 也就是说,s可以转化为t,对应的t也可以转化为s。 解决思路: 我们进行一次的遍历,然后定义了两个dict,来记录s->t,t->s的映射,然后在后面校验一下,这两个dict的value 是否是相同的,来上代码。 class Sol 阅读全文
posted @ 2024-08-19 16:30 TW-NLP 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 这个题目属于简单的类型,使用字典来进行词频统计,如果ransomNote 中key的个数大于magazine,或者ransomNote的key在magazine中找不到,就返回False。 class Solution: def canConstruct(self, ransomNote: str, 阅读全文
posted @ 2024-08-19 15:35 TW-NLP 阅读(1) 评论(0) 推荐(0) 编辑
摘要: 无重复字符的最长子串 这个问题两个思路,要么进行遍历暴力破解,要么进行滑动窗口(巧妙),下面先看一下暴力解法: class Solution: def lengthOfLongestSubstring(self, s: str) -> int: s_count = len(s) max_list = 阅读全文
posted @ 2024-08-16 17:07 TW-NLP 阅读(52) 评论(3) 推荐(0) 编辑
摘要: **问题** 给定一个含有 n 个正整数的数组和一个正整数 target 。 找出该数组中满足其总和大于等于 target 的长度最小的子数组 [numsl, numsl+1, ..., numsr-1, numsr] ,并返回其长度。如果不存在符合条件的子数组,返回 0 。 **注意问题** 子数 阅读全文
posted @ 2024-08-14 17:40 TW-NLP 阅读(16) 评论(0) 推荐(0) 编辑
摘要: 使用Pycharm 连接远程环境,报错:While creating remote tunnel for SshjSshConnection(root@173.19.59.9)@6ac8d3d0: localhost:55453 == localhost:43023: Global request 阅读全文
posted @ 2024-07-31 15:06 TW-NLP 阅读(17) 评论(0) 推荐(0) 编辑
摘要: unzip 解压乱码问题 unzip软件包的unzip命令提供了-O参数(以及-I参数),可以指定编码。 -O CHARSET 为DOS,Windows和OS / 2归档文件指定字符编码-I CHARSET 为UNIX和其他归档文件指定字符编码 可以使用下面的命令进行解压,即制定字符编码集 unzi 阅读全文
posted @ 2024-07-31 10:37 TW-NLP 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 一键语法错误增强工具 欢迎使用我最近开源的使用一键语法错误增强工具,该工具可以进行14种语法错误的增强,不同行业可以根据自己的数据进行错误替换,来训练自己的语法和拼写模型,希望推动行业文本纠错的发展,欢迎Star,14种错误如下所示: 每种错误类型,对应的使用方法,如下所示: 环境的安装 pip i 阅读全文
posted @ 2024-07-29 09:32 TW-NLP 阅读(110) 评论(0) 推荐(1) 编辑
摘要: 题目要求 解答1:暴力解决 class Solution(object): def lengthOfLastWord(self, s): """ :type s: str :rtype: int """ input_list = [i for i in s.split(" ") if i!="" ] 阅读全文
posted @ 2024-07-23 16:43 TW-NLP 阅读(2) 评论(0) 推荐(0) 编辑