05 2022 档案
摘要:509. 斐波那契数 方法1:使用数组将动态规划每个状态存下来 时间复杂度$O(n)$、空间复杂度$O(n)$ class Solution: def fib(self, n: int) -> int: if n == 0:return 0 f = [0] * (n+1) f[1] = 1 for
阅读全文
摘要:6079. 价格减免 pattern = re.compile(r"^\$(\d+\.?\d*)$") if pattern.match(w): 匹配以$开头用^ \ $,以数字结尾用$,其中整数部分可以有1个或多个数字用\d+,小数点0个或1个用.?,小数部分0个或者多个用\d* 6095. 强密
阅读全文
摘要:注意力机制(attention) 图片展示的Encoder-Decoder框架没有体现“注意力模型”,可以把它看做是注意力不集中分心模型。因为在生成目标句子的单词时,不论生成哪个单词,它们使用的输入句子的语义编码C都是一样的,没有任何区别。而语义编码C是由原句子中的每个单词经过Encoder编码产生
阅读全文
摘要:(1)589. N 叉树的前序遍历 class Solution: def preorder(self, root: 'Node') -> List[int]: res = [] def traversal(root): if not root: return res.append(root.val
阅读全文
摘要:函数式编程 定义 所谓函数式编程,是指代码中每一块都是不可变的(immutable),都由纯函数(pure function)的形式组成。这里的纯函数,是指函数本身相互独立、互不影响,对于相同的输入,总会有相同的输出,没有任何副作用。 def multiply_2(l): for index in
阅读全文
摘要:交叉验证既可以解决数据集的数据量不够大问题,也可以解决参数调优的问题。 主要有三种方式:留出验证(HoldOut检验)、k折交叉验证(k-fold交叉验证)、自助法。 留出验证 方法:将原始数据集随机划分成训练集和验证集两部分。尽量保持训练集和测试集分布一致 例如,将样本按照70%~30%的比例分成
阅读全文
摘要:541. 反转字符串 II class Solution: def reverseStr(self, s: str, k: int) -> str: p = 0 while p < len(s): q = p + k s = s[:p] + s[p:q][::-1] + s[q:] p = p +
阅读全文
摘要:pycharm里面新建一个虚拟环境 进入Python Interpreters: 选择Conda Environment,选择需要的Python version 创建好之后的显示: 然后用CMD进入命令行界面,激活该环境 activate BERT_MRC-master cd 文件路径进入requi
阅读全文
摘要:anaconda常用命令 查看Python环境 conda info --env可以看到所有python环境,前面有个‘*’的代表当前环境: 创建环境 conda create --name python35 python=3.5 激活环境 activate py3.7.4 删除环境 conda r
阅读全文
摘要:命名实体识别(Named Entity Recognition,简称NER),又称作“专名识别”,是自然语言处理中的一项基础任务,应用范围非常广泛。 命名实体识别和分词、词性标注都属于序列标注问题。 所谓序列标注问题,就是给你一个字符序列,从左往右遍历每个字符,一边遍历一边对每一个字符分类,分类的体
阅读全文
摘要:分类问题 分类问题的标签是离散的,一般是无序且独立的。 分类问题可以细分为: 二分类问题 是指数据的标签只有两类,比如图片的猫狗识别,只有猫和狗两类。一般用 正样本(1) 和 负样本(0) 来分别表示这两类。 多分类问题 是指数据的标签有多类,比如阿拉伯数字识别,需要根据图片来识别这个数字是 0 至
阅读全文
摘要:LDA模型 LDA是自然语言处理中非常常用的一个主题模型,全称是隐含狄利克雷分布(Latent Dirichlet Allocation)。 作用是将文档集中每篇文档的主题以概率分布的形式给出,然后通过分析分到同一主题下的文档抽取其实际的主题(模型运行结果就是一个索引编号,通过分析,将这种编号赋予实
阅读全文
摘要:互联网与数据科学论坛 图网络数据在跟风拍摄中的实践与应用 快手 生产数分techlead 李健伟 01图网络基本概念概述 图网络应用: 02网络数据在快手的应用现状 03网络数据在跟风拍摄中的实践 风的必要条件:可(易)模仿、生产门槛低、有趣有料、符合大众品味; 跟风:普通ugc和pgc作者能够基于
阅读全文
摘要:整型 # 正无穷: a = float('inf') # 负无穷: b = float('-inf') # 向下取整: mid = (l + r) // 2 # 防止溢出: mid = left + (right - left) // 2 字符型 # 反转字符串 ans = ans[::-1] ##
阅读全文
摘要:700. 二叉搜索树中的搜索 为什么要有返回值: 因为搜索到目标节点就要立即return, 这样才是找到节点就返回(搜索某一条边),如果不加return,就是遍历整棵树了。 class Solution: def searchBST(self, root: TreeNode, val: int) -
阅读全文
摘要:基本框架: #### [704. 二分查找](https://leetcode.cn/problems/binary-search/) 两种写法 ```python class Solution: def search(self, nums: List[int], target: int) -> i
阅读全文
摘要:287. 寻找重复数 快慢指针,类似于找环的入口 从理论上讲,数组中如果有重复的数,那么就会产生多对一的映射,这样,形成的链表就一定会有环路了, 综上 1.数组中有一个重复的整数 <==> 链表中存在环 2.找到数组中的重复整数 <==> 找到链表的环入口 至此,问题转换为 142 题。 class
阅读全文
摘要:200. 岛屿数量 class Solution: def numIslands(self, grid: List[List[str]]) -> int: def dfs(grid, i, j): if not 0 <= i < len(grid) or not 0 <= j < len(grid[
阅读全文
摘要:209. 长度最小的子数组 向右移动右边界,若>=target则收缩左边界 class Solution: def minSubArrayLen(self, target: int, nums: List[int]) -> int: res = float('inf') sum_ = 0 left
阅读全文
摘要:707. 设计链表 单链表 class Node: def __init__(self, val): self.val = val self.next = None class MyLinkedList: def __init__(self): self.head = Node(0) # 虚拟头部节
阅读全文
摘要:104. 二叉树的最大深度 递归法 可以使用前序遍历(中左右),也可以使用后序遍历(左右中),使用前序求的就是深度,使用后序求的是高度。 而根节点的高度就是二叉树的最大深度 class Solution: def maxDepth(self, root: Optional[TreeNode]) ->
阅读全文
摘要:强化学习优化的图神经网络 研究工作1: 研究工作2: 研究工作3: 研究工作4: 研究工作5: Towards a Multi-view Attentive Matching for Personalized Expert Finding 社区问答:为新问题推荐专家发现问题 给定一个目标问题,给其推
阅读全文
摘要:**注意:**如果当前节点会对下面的子节点有整体影响,可以通过辅助函数增长参数列表,借助参数传递信息。 子树题目 101. 对称二叉树 **注意:**只能是“后序遍历”,因为我们要通过递归函数的返回值来判断两个子树的内侧节点和外侧节点是否相等。 正是因为要遍历两棵树而且要比较内侧和外侧节点,所以准确
阅读全文
摘要:神经符号系统-基本原理与案例分析 一、神经符号系统概述 符号主义和连接主义的基本维度: 注:分布表示即embedding 神经符号系统的研究现状: 研究路线图: 典型问题: 二、神经符号系统的新框架 一种新的神经符号系统框架(SRL-NS) 正则化方法: 核心问题:如何量化模型预测对知识的拟合程度?
阅读全文
摘要:二叉树的种类 满二叉树 如果一棵二叉树只有度为0的结点和度为2的结点,并且度为0的结点在同一层上,则这棵二叉树为满二叉树。 深度为k,有2^k-1个节点 完全二叉树 在完全二叉树中,除了最底层节点可能没填满外,其余每层节点数都达到最大值,并且最下面一层的节点都集中在该层最左边的若干位置。若最底层为第
阅读全文
摘要:动态规划: 647. 回文子串 布尔类型的dp[i][j]:表示区间范围[i,j] (注意是左闭右闭)的子串是否是回文子串,如果是dp[i][j]为true,否则为false。 当s[i]与s[j]不相等,dp[i][j]一定是false。 当s[i]与s[j]相等时,有如下三种情况 情况一:下标i
阅读全文
摘要:![](https://img2022.cnblogs.com/blog/2253952/202205/2253952-20220513110913639-900780115.png) 回溯法也可以叫做回溯搜索法,它是一种**搜索的方式**。 回溯是递归的副产品,只要有递归就会有回溯。所以**回溯函
阅读全文
摘要:![](https://img2022.cnblogs.com/blog/2253952/202205/2253952-20220513170850709-1805566190.png) ### 动态规划: #### 子序列(不连续) ##### (1)[300. 最长递增子序列](https://
阅读全文
摘要:动态规划: (1)121. 买卖股票的最佳时机 **注意:**只能买卖一次 class Solution: def maxProfit(self, prices: List[int]) -> int: n = len(prices) dp = [[0] * 2 for _ in range(n)]
阅读全文
摘要:RNN 机器翻译任务:单词的先后顺序会影响句子的意义,句子间的单词数量不是一一对应的, RNN:擅长捕捉序列关系,但只能实现N2N、1toN、Nto1,不能解决N2M的问题, Sequence2sequence:包括编码器和解码器的结构,依然使用的是RNN网络 先由Encoder提取原始句子的'意义
阅读全文
摘要:1.堆栈的区别,应用场景 堆和栈的区别主要有五大点,分别是: 申请方式的不同。栈由系统自动分配,而堆是人为申请开辟; 申请大小的不同。栈获得的空间较小,而堆获得的空间较大; 申请效率的不同。栈由系统自动分配,速度较快,而堆一般速度比较慢; 存储内容的不同。栈在函数调用时,函数调用语句的下一条可执行语
阅读全文
摘要:背包递推公式 问能否能装满背包(或者最多装多少):dp[j] = max(dp[j], dp[j - nums[i]] + nums[i]); ,对应题目如下: 416.分割等和子集 如果使用一维dp数组,物品遍历的for循环放在外层,遍历背包的for循环放在内层,且内层for循环倒序遍历! cla
阅读全文
摘要:###一、问:图神经网络一般用几层?是否像CNN、RNN一样层数越多越好? 答:一般2-3层效果就比较好了,层数过多会出现过平滑问题,即经过多次邻居节点特征的聚合,所有节点的特征都会变得相似,就不能进行区分了。 图卷积会使同一连通分量内的节点的表征趋向于收敛到同一个值。 ###二、问:如果要使用多层
阅读全文
摘要:![](https://img2022.cnblogs.com/blog/2253952/202205/2253952-20220506152657922-1126705847.jpg) ####(1)[912. 排序数组](https://leetcode-cn.com/problems/sort
阅读全文
摘要:1、Kmeans 是无监督学习,是一种聚类算法。 步骤: 1.初始化一个常数K,也就是最终的聚类类别数,随机选取K个质心; 2.计算每个样本与质心的相似度,把它归到最相似的类中; 3.重新计算每个类的质心,重复上述步骤,直到质心不再改变; 4.最后输出每个样本所属的类以及每个类的质心。 注:可以通过
阅读全文
摘要:引入头文件 有些笔试是ACM模式,需要自己处理输入输出,还要自己添加头文件,在这里整理一下 #include <iostream> #include <string> #include <vector>//数组 #include <queue>//队列 #include <stack>//栈 #in
阅读全文
摘要:27. 移除元素 用快慢指针,快指针将慢指针位置的数覆盖 class Solution: def removeElement(self, nums: List[int], val: int) -> int: fast, slow = 0, 0 while fast < len(nums): if n
阅读全文
摘要:一大早来实验室打开电脑就又遇到问题了 😟 本来以为是校园网的问题,结果把实验室的两个网也试了一遍还是连不上,看到提示'代理服务器出现问题或者地址有误' 想到昨天晚上FQ没有下线就直接关机了,可能跟这个有关 操作步骤: 设置->网络和Internet->代理 把‘使用代理服务器’关了,再刷新网页就行
阅读全文
摘要:Embedding在数学上是一个函数,将一个空间的点映射到另一个空间,通常是从高维抽象的空间映射到低维的具象空间。 Embedding的作用: 将高维数据转换到低维利于算法的处理; 同时解决one-hot向量长度随样本的变化而变化,以及无法表示两个实体之间的相关性这一问题。 Graph Embedd
阅读全文
摘要:矩阵与向量的关系 矩阵是由m×n个数组成的一个m行n列的矩形表格。特别地,一个m×1矩阵也称为一个m维列向量;而一个1×n矩阵,也称为一个n维行向量。因此向量可以看作特殊的矩阵。 矩阵相乘 要求左矩阵的列和右矩阵的行数要一样,即MxN维矩阵乘以NxY维矩阵。 $a=\begin{pmatrix} 1
阅读全文