老张哈哈哈 - 博客园

2021年8月18日

摘要： imghdr python有一个自带的函数，可以获取图片类型 imghdr.what(f, h=None) f可以是一个文件路径，也可以是一个打开的文件类型例如： import imghdr imghdr.what('path/to/ur/image') 结果等价于 import imghdr f 阅读全文

posted @ 2021-08-18 16:30 老张哈哈哈阅读(1578) 评论(0) 推荐(0) 编辑

2021年4月20日

finetune cnocr

摘要：制作数据集这里用的是text-render制作的数据集，这个开源项目可以制作包含中英文字符的数据，但是这里我们想要制作包含希腊字母的数据，项目本身不支持希腊字母，因此首先需要下载支持希腊字母的字体，我下载的是Gentium和arial-unicode-ms，下载完之后还需要制作一个包含要生成希腊阅读全文

posted @ 2021-04-20 15:00 老张哈哈哈阅读(372) 评论(0) 推荐(0) 编辑

2020年6月28日

python生成随机数

摘要：主要用到了python中的random和numpy 生成随机整数生成m~n以内的随机数 >>> import random >>> random.randint(0,10) 1 >>> random.randint(0,10) 9 >>> random.randint(0,10) 6 生成k个m~ 阅读全文

posted @ 2020-06-28 10:25 老张哈哈哈阅读(1622) 评论(0) 推荐(0) 编辑

2020年6月27日

自然语言处理----词袋模型

摘要：词袋模型是一种表征文本数据的方法,可以从文本数据中提取出特征并用向量表示.词袋模型主要包括两件事构建词汇表确定度量单词出现的方法词袋模型不考虑单词在文本中出现的顺序,只考虑单词是否出现. 具体以"双城记"开头为例收集数据 It was the best of times, it was th 阅读全文

posted @ 2020-06-27 12:42 老张哈哈哈阅读(1555) 评论(0) 推荐(0) 编辑

2020年6月21日

c++ 数组定义及初始化

摘要： C ++提供了一种数据结构，即数组，该数组存储一个固定大小的由相同类型元素构成的顺序集合。数组中的元素存储在一个连续内存位置中,元素可通过数组索引访问, 最低地址对应于第一个元素，最高地址对应于最后一个元素。声明数组例如声明固定长度的数组: const int Size = 5; int a 阅读全文

posted @ 2020-06-21 17:00 老张哈哈哈阅读(8381) 评论(0) 推荐(1) 编辑

2020年6月3日

[解决] Assertion `srcIndex < srcSelectDimSize` failed.

摘要：在finetune Chinese GPT2的时候遇到如上错误，错误原因index越界，原始代码中给定的输入长度是1024，但是我使用模型可接受的输入长度是512，把输入长度都改为512，错误解决阅读全文

posted @ 2020-06-03 14:59 老张哈哈哈阅读(12362) 评论(0) 推荐(0) 编辑

2020年4月29日

tensorflow学习--数据加载

摘要：文章主要来自 "Tensorflow官方文档" ，同时加入了自己的理解以及部分代码数据读取 TensorFlow程序读取数据一共有3种方法: 供给数据(Feeding)：在TensorFlow程序运行的每一步，让Python代码来供给数据。从文件读取数据：在TensorFlow图的起始，阅读全文

posted @ 2020-04-29 23:08 老张哈哈哈阅读(627) 评论(0) 推荐(0) 编辑

2020年3月28日

图像插值算法总结

摘要：插值指的是利用已知数据去预测未知数据，图像插值则是给定一个像素点，根据它周围像素点的信息来对该像素点的值进行预测。当我们调整图片尺寸或者对图片变形的时候常会用到图片插值。比如说我们想把一个4x4的图片，就会产生一些新的像素点（如下图红点所示），如何给这些值赋值，就是图像插值所要解决的问题, 阅读全文

posted @ 2020-03-28 11:36 老张哈哈哈阅读(22577) 评论(0) 推荐(0) 编辑

2020年3月22日

linux中的grep命令

摘要：定义：grep用来搜索文件中符合条件的字符串，并返回包含该字符串的所有行语法： grep [options] pattern [files] 一些常见选项的解释 -c : 计算包含样式的行数 -h : 显示包含该样式的行，但是不显示该行所属的文件的名字 -i : 忽略字符大小写的差别 -l : 只阅读全文

posted @ 2020-03-22 11:36 老张哈哈哈阅读(1870) 评论(0) 推荐(0) 编辑

2020年3月18日

安装mmdetection，运行报错Segmentation fault

摘要：具体安装过程详见https://github.com/open-mmlab/mmdetection/blob/master/docs/INSTALL.md 在安装完成mmdetection后运行test文件报错Segmentation fault(core dumped)，查询后发现是由于gcc版本阅读全文

posted @ 2020-03-18 13:10 老张哈哈哈阅读(1588) 评论(0) 推荐(0) 编辑

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论