摘要:
imghdr python有一个自带的函数,可以获取图片类型 imghdr.what(f, h=None) f可以是一个文件路径,也可以是一个打开的文件类型 例如: import imghdr imghdr.what('path/to/ur/image') 结果等价于 import imghdr f 阅读全文
摘要:
制作数据集 这里用的是text-render制作的数据集, 这个开源项目可以制作包含中英文字符的数据,但是这里我们想要制作包含希腊字母的数据,项目本身不支持希腊字母,因此首先需要下载支持希腊字母的字体,我下载的是Gentium和arial-unicode-ms,下载完之后还需要制作一个包含要生成希腊 阅读全文
摘要:
主要用到了python中的random和numpy 生成随机整数 生成m~n以内的随机数 >>> import random >>> random.randint(0,10) 1 >>> random.randint(0,10) 9 >>> random.randint(0,10) 6 生成k个m~ 阅读全文
摘要:
词袋模型是一种表征文本数据的方法,可以从文本数据中提取出特征并用向量表示.词袋模型主要包括两件事 构建词汇表 确定度量单词出现的方法 词袋模型不考虑单词在文本中出现的顺序,只考虑单词是否出现. 具体以"双城记"开头为例 收集数据 It was the best of times, it was th 阅读全文
摘要:
C ++提供了一种数据结构,即数组,该数组存储一个固定大小的由相同类型元素构成的顺序集合。 数组中的元素存储在一个连续内存位置中,元素可通过数组索引访问, 最低地址对应于第一个元素,最高地址对应于最后一个元素。 声明数组 例如 声明固定长度的数组: const int Size = 5; int a 阅读全文
摘要:
在finetune Chinese GPT2的时候遇到如上错误,错误原因index越界,原始代码中给定的输入长度是1024,但是我使用模型可接受的输入长度是512,把输入长度都改为512,错误解决 阅读全文
摘要:
文章主要来自 "Tensorflow官方文档" ,同时加入了自己的理解以及部分代码 数据读取 TensorFlow程序读取数据一共有3种方法: 供给数据(Feeding): 在TensorFlow程序运行的每一步, 让Python代码来供给数据。 从文件读取数据: 在TensorFlow图的起始, 阅读全文
摘要:
插值指的是利用已知数据去预测未知数据,图像插值则是给定一个像素点,根据它周围像素点的信息来对该像素点的值进行预测。当我们调整图片尺寸或者对图片变形的时候常会用到图片插值。比如说我们想把一个4x4的图片, 就会产生一些新的像素点( 如下图红点所示), 如何给这些值赋值, 就是图像插值所要解决的问题, 阅读全文
摘要:
定义:grep用来搜索文件中符合条件的字符串,并返回包含该字符串的所有行 语法: grep [options] pattern [files] 一些常见选项的解释 -c : 计算包含样式的行数 -h : 显示包含该样式的行,但是不显示该行所属的文件的名字 -i : 忽略字符大小写的差别 -l : 只 阅读全文
摘要:
具体安装过程详见https://github.com/open-mmlab/mmdetection/blob/master/docs/INSTALL.md 在安装完成mmdetection后运行test文件报错Segmentation fault(core dumped),查询后发现是由于gcc版本 阅读全文