06 2021 档案

摘要:# 给定一个无重复元素的数组 candidates 和一个目标数 target ,找出 candidates 中所有可以使数字和为 target 的组合。 # # candidates 中的数字可以无限制重复被选取。 # # 说明: # # # 所有数字(包括 target)都是正整数。 # 解集不 阅读全文
posted @ 2021-06-30 22:02 今夜无风 阅读(43) 评论(0) 推荐(0) 编辑
摘要:# 给定一个按照升序排列的整数数组 nums,和一个目标值 target。找出给定目标值在数组中的开始位置和结束位置。 # # 如果数组中不存在目标值 target,返回 [-1, -1]。 # # 进阶: # # # 你可以设计并实现时间复杂度为 O(log n) 的算法解决此问题吗? # # # 阅读全文
posted @ 2021-06-30 16:25 今夜无风 阅读(124) 评论(0) 推荐(0) 编辑
摘要:# 实现获取 下一个排列 的函数,算法需要将给定数字序列重新排列成字典序中下一个更大的排列。 # # 如果不存在下一个更大的排列,则将数字重新排列成最小的排列(即升序排列)。 # # 必须 原地 修改,只允许使用额外常数空间。 # # # # 示例 1: # # # 输入:nums = [1,2,3 阅读全文
posted @ 2021-06-30 14:37 今夜无风 阅读(36) 评论(0) 推荐(0) 编辑
摘要:该文章信息量非常大,很多trick都具有极高的研究价值,可以应用到工程提升中。 参考该知乎:https://zhuanlan.zhihu.com/p/333202482 阅读全文
posted @ 2021-06-29 21:19 今夜无风 阅读(116) 评论(0) 推荐(0) 编辑
摘要:# 将两个升序链表合并为一个新的 升序 链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。 # # # # 示例 1: # # # 输入:l1 = [1,2,4], l2 = [1,3,4]# 输出:[1,1,2,3,4,4]# 方法一:递归,将较小值得节点参与到下一次比较中 # leet 阅读全文
posted @ 2021-06-29 20:22 今夜无风 阅读(219) 评论(0) 推荐(0) 编辑
摘要:最近有幸看到美团知识图谱,专业性很强,业务场景中的应用也不错,大家可以借鉴学习下。 参考地址:https://mp.weixin.qq.com/s?src=11&timestamp=1624952442&ver=3159&signature=RVyvH4HBVEteaiJ6vaPzy-iiiRMMG 阅读全文
posted @ 2021-06-29 16:39 今夜无风 阅读(186) 评论(0) 推荐(0) 编辑
摘要:TextBrewer is a PyTorch-based model distillation toolkit for natural language processing. It includes various distillation techniques from both NLP an 阅读全文
posted @ 2021-06-29 15:11 今夜无风 阅读(243) 评论(0) 推荐(0) 编辑
摘要:# 给定一个只包括 '(',')','{','}','[',']' 的字符串 s ,判断字符串是否有效。 # # 有效字符串需满足: # # # 左括号必须用相同类型的右括号闭合。 # 左括号必须以正确的顺序闭合。 # # # # # 示例 1: # # # 输入:s = "()"# 输出:true 阅读全文
posted @ 2021-06-29 13:54 今夜无风 阅读(154) 评论(0) 推荐(0) 编辑
摘要:# 给你一个链表,删除链表的倒数第 n 个结点,并且返回链表的头结点。 # # 进阶:你能尝试使用一趟扫描实现吗? # # # # 示例 1: # # # 输入:head = [1,2,3,4,5], n = 2# 输出:[1,2,3,5] 方法:双指针 # leetcode submit regi 阅读全文
posted @ 2021-06-29 08:24 今夜无风 阅读(38) 评论(0) 推荐(0) 编辑
摘要:基于SimBERT生成相似文本和检索相似文本的能力,我们会在文本分类任务中通过SimBERT来获取更多的伪标签语料。通过SimBERT根据现有的标注语料来生成相似文本,或者构建搜索库从搜索库中检索相似文本可以获取很多语义相关性较好的伪标签语料数据。这在实际的业务中也证明了可以有效提升我们分类器的效果 阅读全文
posted @ 2021-06-28 15:51 今夜无风 阅读(195) 评论(0) 推荐(0) 编辑
摘要:实现一个正则表达式匹配,力扣-10 # 给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。 # # # '.' 匹配任意单个字符 # '*' 匹配零个或多个前面的那一个元素 # # # 所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。 # # 阅读全文
posted @ 2021-06-28 15:04 今夜无风 阅读(45) 评论(0) 推荐(0) 编辑
摘要:# 给你一个字符串 s,找到 s 中最长的回文子串。 # # # # 示例 1: # # # 输入:s = "babad"# 输出:"bab"# 解释:"aba" 同样是符合题意的答案。 方法一:动态规划 # leetcode submit region begin(Prohibit modific 阅读全文
posted @ 2021-06-25 07:53 今夜无风 阅读(32) 评论(0) 推荐(0) 编辑
摘要:# 给定两个大小分别为 m 和 n 的正序(从小到大)数组 nums1 和 nums2。请你找出并返回这两个正序数组的 中位数 。 # # # # 示例 1: # # # 输入:nums1 = [1,3], nums2 = [2]# 输出:2.00000# 解释:合并数组 = [1,2,3] ,中位 阅读全文
posted @ 2021-06-24 20:23 今夜无风 阅读(206) 评论(0) 推荐(0) 编辑
摘要:# 给定一个字符串,请你找出其中不含有重复字符的 最长子串 的长度。 # # # # 示例 1: # # # 输入: s = "abcabcbb"# 输出: 3 # 解释: 因为无重复字符的最长子串是 "abc",所以其长度为 3。 方法: def lengthOfLongestSubString( 阅读全文
posted @ 2021-06-23 11:47 今夜无风 阅读(42) 评论(0) 推荐(0) 编辑
摘要:# 给你两个 非空 的链表,表示两个非负的整数。它们每位数字都是按照 逆序 的方式存储的,并且每个节点只能存储 一位 数字。 # # 请你将两个数相加,并以相同形式返回一个表示和的链表。 # # 你可以假设除了数字 0 之外,这两个数都不会以 0 开头。 # # # # 示例 1: # # # 输入 阅读全文
posted @ 2021-06-23 10:46 今夜无风 阅读(46) 评论(0) 推荐(0) 编辑
摘要:官方提供的bert是使用tpu集群训练的代码,他可以兼容单核GPU、多核CPU,如果你的机器有多个GPU,直接运行python run_pretraining.py,发现只能利用一个GPU。其实git上已经有人提供了多GPU版本,亲证是可行的,只需要将他的run_pretraining_gpu.py 阅读全文
posted @ 2021-06-22 17:33 今夜无风 阅读(369) 评论(0) 推荐(0) 编辑
摘要:一个观点:在所属领域内重新对bert模型做预训练后,对于下游任务性能必定会带来提升。 实验:观察在下游ner任务中的loss变化情况 1)原始bert 全局评估:{'acc': 0.7899749373433584, 'recall': 0.7831704488984595, 'f1': 0.786 阅读全文
posted @ 2021-06-22 14:47 今夜无风 阅读(401) 评论(0) 推荐(0) 编辑
摘要:给定一个具体的学习任务,研究人员如何为这个任务确定一个可行的模型结构。给出了各种不同体系结构和不同性能的模型复杂性,研究人员如何从中挑选出最好的模型?这就是模型选择和设计问题。 一般来说,模型的选择和设计是基于两者之间的权衡,预测性能和模型复杂性。 一方面,高精度的预测是学习模型的基本目标。模型应该 阅读全文
posted @ 2021-06-19 10:19 今夜无风 阅读(391) 评论(0) 推荐(0) 编辑
摘要:1、相比RNN模型,Transformer语义特征提取能力更强,具备长距离特征捕获能力,且可以并行训练,在机器翻译等NLP任务上效果显著。Open AI团队的GPT[7]使用Transformer替换RNN进行深层单向语言模型预训练,并通过在下游任务上Fine-tuning验证了Pretrain-F 阅读全文
posted @ 2021-06-05 21:24 今夜无风 阅读(612) 评论(0) 推荐(0) 编辑
摘要:问题: 例如,ip地址为10.0.3.193,把每段拆分成一个二进制形式组合起来为00001010 00000000 00000011 11000001,然后把这个二进制数转变成十进制整数就是167773121。 原文描述: 给你一个IP4的地址,请转成十进制整数 (2021-03 腾讯-PCG-前 阅读全文
posted @ 2021-06-02 23:54 今夜无风 阅读(612) 评论(0) 推荐(0) 编辑
摘要:问题: # 给你两个单词 word1 和 word2,请你计算出将 word1 转换成 word2 所使用的最少操作数 。 # # 你可以对一个单词进行如下三种操作: # # # 插入一个字符 # 删除一个字符 # 替换一个字符 # # # # # 示例 1: # # # 输入:word1 = "h 阅读全文
posted @ 2021-06-02 19:17 今夜无风 阅读(52) 评论(0) 推荐(0) 编辑