摘要:
注意力机制(attention) 图片展示的Encoder-Decoder框架没有体现“注意力模型”,可以把它看做是注意力不集中分心模型。因为在生成目标句子的单词时,不论生成哪个单词,它们使用的输入句子的语义编码C都是一样的,没有任何区别。而语义编码C是由原句子中的每个单词经过Encoder编码产生 阅读全文
摘要:
(1)589. N 叉树的前序遍历 class Solution: def preorder(self, root: 'Node') -> List[int]: res = [] def traversal(root): if not root: return res.append(root.val 阅读全文
摘要:
函数式编程 定义 所谓函数式编程,是指代码中每一块都是不可变的(immutable),都由纯函数(pure function)的形式组成。这里的纯函数,是指函数本身相互独立、互不影响,对于相同的输入,总会有相同的输出,没有任何副作用。 def multiply_2(l): for index in 阅读全文
摘要:
交叉验证既可以解决数据集的数据量不够大问题,也可以解决参数调优的问题。 主要有三种方式:留出验证(HoldOut检验)、k折交叉验证(k-fold交叉验证)、自助法。 留出验证 方法:将原始数据集随机划分成训练集和验证集两部分。尽量保持训练集和测试集分布一致 例如,将样本按照70%~30%的比例分成 阅读全文
摘要:
541. 反转字符串 II class Solution: def reverseStr(self, s: str, k: int) -> str: p = 0 while p < len(s): q = p + k s = s[:p] + s[p:q][::-1] + s[q:] p = p + 阅读全文
摘要:
pycharm里面新建一个虚拟环境 进入Python Interpreters: 选择Conda Environment,选择需要的Python version 创建好之后的显示: 然后用CMD进入命令行界面,激活该环境 activate BERT_MRC-master cd 文件路径进入requi 阅读全文
摘要:
anaconda常用命令 查看Python环境 conda info --env可以看到所有python环境,前面有个‘*’的代表当前环境: 创建环境 conda create --name python35 python=3.5 激活环境 activate py3.7.4 删除环境 conda r 阅读全文
摘要:
命名实体识别(Named Entity Recognition,简称NER),又称作“专名识别”,是自然语言处理中的一项基础任务,应用范围非常广泛。 命名实体识别和分词、词性标注都属于序列标注问题。 所谓序列标注问题,就是给你一个字符序列,从左往右遍历每个字符,一边遍历一边对每一个字符分类,分类的体 阅读全文
摘要:
分类问题 分类问题的标签是离散的,一般是无序且独立的。 分类问题可以细分为: 二分类问题 是指数据的标签只有两类,比如图片的猫狗识别,只有猫和狗两类。一般用 正样本(1) 和 负样本(0) 来分别表示这两类。 多分类问题 是指数据的标签有多类,比如阿拉伯数字识别,需要根据图片来识别这个数字是 0 至 阅读全文
摘要:
LDA模型 LDA是自然语言处理中非常常用的一个主题模型,全称是隐含狄利克雷分布(Latent Dirichlet Allocation)。 作用是将文档集中每篇文档的主题以概率分布的形式给出,然后通过分析分到同一主题下的文档抽取其实际的主题(模型运行结果就是一个索引编号,通过分析,将这种编号赋予实 阅读全文