TW-NLP - 博客园

2025年3月7日

摘要：项目地址：GitHub - TW-NLP/ChineseErrorCorrector: 中文拼写错误和语法错误纠正文本纠错任务在审查、写作任务中至关重要，以前的纠错大多采用小模型进行训练，例如BART、T5、BERT等，但是小模型的泛化性较差，需要在不同领域训练不同的小模型进行纠错，为此我们使阅读全文

posted @ 2025-03-07 09:36 TW-NLP 阅读(183) 评论(0) 推荐(0) 编辑

2025年2月18日

ImportError: /***/py38-office/bin/../lib/libgomp.so.1: cannot allocate memory in static TLS block

摘要： vim ~/.bashrc export LD_PRELOAD=/***/py38-office/lib/libgomp.so.1 阅读全文

posted @ 2025-02-18 15:05 TW-NLP 阅读(1) 评论(0) 推荐(0) 编辑

2025年2月11日

Terminal entry not found in terminfo 'screen.linux' not konwn，使用vim 后上下左右变为ABCD

摘要： export TERM=xterm 阅读全文

posted @ 2025-02-11 14:10 TW-NLP 阅读(5) 评论(0) 推荐(0) 编辑

2024年10月12日

others

摘要： import cv2 import numpy as np import math # 原始图像路径 image_path = "path_to_image.jpg" # 读取原始图像 image = cv2.imread(image_path) # polygons 坐标 (左上、右上、右下、左下阅读全文

posted @ 2024-10-12 15:29 TW-NLP 阅读(9) 评论(0) 推荐(0) 编辑

2024年9月25日

插入区间

摘要：与上篇的合并区间类似，插入区间的描述是：给你一个无重叠的，按照区间起始端点排序的区间列表 intervals，其中 intervals[i] = [starti, endi] 表示第 i 个区间的开始和结束，并且 intervals 按照 starti 升序排列。同样给定一个区间 newInt 阅读全文

posted @ 2024-09-25 17:31 TW-NLP 阅读(24) 评论(0) 推荐(0) 编辑

合并区间

摘要：对下面的区间进行合并，实例如下：输入：intervals = [[1,3],[2,6],[8,10],[15,18]] 输出：[[1,6],[8,10],[15,18]] 解释：区间 [1,3] 和 [2,6] 重叠, 将它们合并为 [1,6]. 解决问题的思路：（1）先将区间进行排序（按左区阅读全文

posted @ 2024-09-25 09:23 TW-NLP 阅读(7) 评论(0) 推荐(0) 编辑

2024年9月19日

汇总区间

摘要：给定一个有序的list, 需要根据数据的连续性进行区间的汇总实例如下：解决方法：设置左右指针，固定左指针，当右指针对应的数+1=右指针+1对应的数 and 右指针不要越界，就移动右指针，直到跳出while，并更新左指针=右指针+1 class Solution(object): def sum 阅读全文

posted @ 2024-09-19 15:00 TW-NLP 阅读(8) 评论(0) 推荐(0) 编辑

2024年9月6日

中英文关键词抽取

摘要：中英文关键词抽取欢迎使用中英文关键词抽取工具，本工具支持多种关键词抽取算法，帮助用户从文本中快速提取重要信息。下图展示了我们所支持的关键词抽取算法：介绍本工具提供多种关键词抽取算法，满足不同需求。支持的算法如下： TF-IDF：通过词频和逆文档频率来衡量词汇的重要性。 TextRank：基于图阅读全文

posted @ 2024-09-06 10:06 TW-NLP 阅读(118) 评论(0) 推荐(0) 编辑

2024年8月29日

哈希-快乐数

摘要：解决这个问题的关键在于，判断结束遍历的条件，即当n!=1 或者在循环过程中，没有出现过重复的数。 class Solution: def isHappy(self, n: int) -> bool: def get_score(n): sum_ = 0 while n > 0: end_ = n 阅读全文

posted @ 2024-08-29 09:39 TW-NLP 阅读(9) 评论(0) 推荐(0) 编辑

2024年8月22日

TF-IDF 算法原理以及源码实现

摘要： TF-IDF（Term Frequency-Inverse Document Frequency），是用来衡量一个词在文档中的重要性，下面看一下TDF-IDF的公式：首先是TF，也就是词频，用来衡量一个词在文档中出现频率的指标。假设某词在文档中出现了( n )次，而文档总共包含( N )个词，则该阅读全文

posted @ 2024-08-22 11:18 TW-NLP 阅读(779) 评论(2) 推荐(0) 编辑

TW-NLP 厚积薄发

公告

搜索

常用链接

我的标签

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论