摘要: 题目: 给你两个单词 word1 和 word2,请你计算出将 word1 转换成 word2 所使用的最少操作数 。 你可以对一个单词进行如下三种操作: 插入一个字符 删除一个字符 替换一个字符 题解: class Solution { public: int minDistance(string 阅读全文
posted @ 2020-04-06 11:54 司念 阅读(64) 评论(0) 推荐(0) 编辑
摘要: 题目: 请你为 最不经常使用(LFU)缓存算法设计并实现数据结构。它应该支持以下操作:get 和 put。 get(key) - 如果键存在于缓存中,则获取键的值(总是正数),否则返回 -1。 put(key, value) - 如果键不存在,请设置或插入值。当缓存达到其容量时,则应该在插入新项之前 阅读全文
posted @ 2020-04-06 11:52 司念 阅读(80) 评论(0) 推荐(0) 编辑
摘要: 咳咳 在学校就不好好学C++ 现在惨了吧 啥也不会 好 那么来补充一下关于unordered_map的一些简单操作吧 定义 它叫做:无序映射。 C++ STL中的unordered_map实现使用了哈希表,在O(1)的时间实现对元素的查找,但是相应地在空间的开销增大了。 一些资料上比较了它和map的 阅读全文
posted @ 2020-04-06 11:47 司念 阅读(453) 评论(0) 推荐(1) 编辑
摘要: 题目: 给定 n 个非负整数表示每个宽度为 1 的柱子的高度图,计算按此排列的柱子,下雨之后能接多少雨水。 示例: 输入: [0,1,0,2,1,0,1,3,2,1,2,1] 输出: 6 解题思路: 首先构建两个栈,h存高度,idx存下标。 遍历数组,将height[i]与h.top()做比较 若h 阅读全文
posted @ 2020-04-04 14:09 司念 阅读(70) 评论(0) 推荐(0) 编辑
摘要: No.53:最大子序列和 首先对数组进行遍历,当前最大连续子序列和为 sum,结果为 ans。 如果 sum > 0,则说明 sum 对结果有增益效果,则 sum 保留并加上当前遍历数字 如果 sum ⇐ 0,则说明 sum 对结果无增益效果,需要舍弃,则 sum 直接更新为当前遍历数字 这种方法可 阅读全文
posted @ 2020-04-03 12:02 司念 阅读(89) 评论(0) 推荐(0) 编辑
摘要: 题目: 首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。接下来的转化规则如下: 如果第一个非空字符为正或者负号时,则将该符号与之后面尽可能多的连续数字字符组合起来,形成一个有符号整数。 假如第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成一个整数。 阅读全文
posted @ 2020-04-03 11:59 司念 阅读(113) 评论(0) 推荐(0) 编辑
摘要: 题目: 给定一个包含 m × n 个格子的面板,每一个格子都可以看成是一个细胞。每个细胞都具有一个初始状态:1 即为活细胞(live),或 0 即为死细胞(dead)。 每个细胞与其八个相邻位置(水平,垂直,对角线)的细胞都遵循以下四条生存定律: 如果活细胞周围八个位置的活细胞数少于两个,则该位置活 阅读全文
posted @ 2020-04-02 22:13 司念 阅读(99) 评论(0) 推荐(0) 编辑
摘要: 本文主要解决如何将CAIL2019阅读理解数据json文件,并对数据内容进行基础分析,然后进行分词等操作。 数据预处理 首先引入需要的库吧,以后一定会用到的。 读取文件并分析 看了很多获胜者的分享,第一步无非都是要先看看数据集的规模,有哪些可能的特征。 因此我的第一步是读取文件内容,并进行简单的数据 阅读全文
posted @ 2020-03-15 15:25 司念 阅读(892) 评论(0) 推荐(0) 编辑
摘要: 进程管理 进程与线程 概念 定义:进程是进程实体的运行过程,是系统进行资源分配和调度的一个独立单位。 组成: 1. PCB:进程存在的唯一标志。PID不同。 2. 程序段:存放程序代码。 3. 数据段:存放程序运行中的数据。 组织形式: 1. 链接方式:按照进程状态将PCB分为多个队列,链表连接方式 阅读全文
posted @ 2020-02-29 13:22 司念 阅读(591) 评论(0) 推荐(0) 编辑
摘要: 图像增强 图像增广(image augmentation)技术通过对训练图像做一系列随机改变,来产生相似但又不同的训练样本,从而扩大训练数据集的规模。图像增广的另一种解释是,随机改变训练样本可以降低模型对某些属性的依赖,从而提高模型的泛化能力。例如,我们可以对图像进行不同方式的裁剪,使感兴趣的物体出 阅读全文
posted @ 2020-02-25 20:32 司念 阅读(363) 评论(0) 推荐(0) 编辑
摘要: word2vec WordEmbedding 对词汇进行多维度的描述,形成一个密集的矩阵。这样每两个词之间的相似性可以通过进行内积的大小体现出来。越大说明距离越远,则越不相似。 Analogies(类比):将男 女和国王 女王做类比,比如将表示‘男’的词向量与‘女’的词向量相减,同理国王和女王也相减 阅读全文
posted @ 2020-02-25 20:24 司念 阅读(514) 评论(0) 推荐(0) 编辑
摘要: 批量归一化 通常来说,数据标准化预处理对于浅层模型就足够有效了。随着模型训练的进行,当每层中参数更新时,靠近输出层的输出较难出现剧烈变化。但对深层神经网络来说,即使输入数据已做标准化, 训练中模型参数的更新依然很容易造成靠近输出层输出的剧烈变化 。这种计算数值的不稳定性通常令我们难以训练出有效的深度 阅读全文
posted @ 2020-02-25 20:03 司念 阅读(431) 评论(0) 推荐(0) 编辑
摘要: 现在是2020年2月20日23点53分。 今天下午胆战心惊的查分数,连准考证都没输,成绩就直接出来了。 政治73,英语81,数学99,专业课121,总分374,完全出乎我的意料。感谢福大不杀之恩,我活着出来了。 在备考的那段时间,我也有心情低落焦虑的时候,并且很频繁,就好像有把刀子悬在我的背后,不敢 阅读全文
posted @ 2020-02-21 00:36 司念 阅读(200) 评论(2) 推荐(2) 编辑
摘要: MachineTranslation 实现过程 rstrip():删除 string 字符串末尾的指定字符(默认为空格)。 语法:str.rstrip([chars]) 参数:chars 指定删除的字符(默认为空格) 返回值:返回删除 string 字符串末尾的指定字符后生成的新字符串 torcht 阅读全文
posted @ 2020-02-18 19:56 司念 阅读(259) 评论(0) 推荐(0) 编辑
摘要: 循环神经网络进阶 BPTT 反向传播过程中,训练模型通常需要模型参数的梯度。 $$ \frac{\partial L}{\partial \boldsymbol{W}_{qh}} = \sum_{t=1}^T \text{prod}\left(\frac{\partial L}{\partial \ 阅读全文
posted @ 2020-02-17 15:28 司念 阅读(416) 评论(0) 推荐(0) 编辑
摘要: 文本预处理 实现步骤(处理语言模型数据集距离) 文本预处理的实现步骤 读入文本:读入zip / txt 等数据集 分词:把换行符替换成空格。如果处理的是英文,最好把大写改成小写。(因为第一次接触文本处理,理解的都很浅显) 建立字典,将每个词映射到一个唯一的索引(index):将每个字符映射成一个从0 阅读全文
posted @ 2020-02-14 16:51 司念 阅读(300) 评论(0) 推荐(1) 编辑
摘要: 线性回归 基础知识 实现过程 学习笔记 批量读取 torch_data = Data.TensorDataset(features, labels) dataset = Data.DataLoader(torch_data, batch_size, shuffle=True) 定义模型的两种常见写法 阅读全文
posted @ 2020-02-14 16:13 司念 阅读(574) 评论(0) 推荐(0) 编辑
摘要: squeeze的用法主要就是对数据的维度进行压缩或者解压。 squeeze() :去掉a中维数为1的维度。 :去掉特定维度N下维数为1的维度。 :a中去掉指定的维数为1的维度。 unsqueeze() :在a中指定位置N加上一个维数为1的维度。 :在a中指定位置N加上一个维数为1的维度。 阅读全文
posted @ 2020-02-02 20:20 司念 阅读(458) 评论(0) 推荐(0) 编辑
摘要: CNN原理和结构 观点提出 关于照片的三种观点引出了CNN的作用。 1. 局部性:某一特征只出现在一张image的局部位置中。 2. 相同性: 同一特征重复出现。例如鸟的羽毛。 3. 不变性:subsampling下图片性质不变。类似于图片压缩。 相比与Fully Connected,减少了权重数目 阅读全文
posted @ 2020-02-02 19:58 司念 阅读(244) 评论(0) 推荐(0) 编辑
摘要: 1. Numpy VS Torch 2. Variable 3. Activation Function 激励函数 画图 4. Regression 回归 5. Classification 分类 6. 快速搭建法 7. 保存提取 使用两种方式提取整个神经网络:提取整个网络或只提取参数。 两段式声明 阅读全文
posted @ 2020-02-01 23:09 司念 阅读(253) 评论(0) 推荐(0) 编辑