摘要:
1.训练集各类样本比例不均(样本不平衡) 方法: 1.过采样: 缺点:错误(噪声)样本可能造成较大影响 2.欠采样: 缺点:丢样本 损失较大 3.扩大数据集: a.抽取部分样本,求平均 b.随机噪声 (2.如果训练集样本与测试集样本本身有巨大的gap,训练的过程总是让人煎熬) 阅读全文
摘要:
上传:sz -filename 下载:rz -y 阅读全文
摘要:
1.使用auto-encoder生成手写数字 2.中间code层使用二维向量,使用L2norm处理中间层数据 3.从[-1,1]的矩形框中等间隔选取100个坐标点 作为code值 最终生成图像 后期应该查看一下步骤2处理后的数据分布,因为正中间的点生成了四不像 阅读全文
摘要:
https://discuss.pytorch.org/t/guidelines-for-assigning-num-workers-to-dataloader/813/5 num_workers 影响机器性能 阅读全文
摘要:
CIFAR-10 图像处理:(预处理还是很重要的) 数据随机裁剪,填充0 依概率p水平翻转 1.VGG16 SGD lr=0.01 momentum 0.9 weight_decay=0.0001 epoch=25 batchsize=128 测试集正确率 90.4% 修改lr /= 10 epoc 阅读全文
摘要:
1.tmux 阅读全文
摘要:
1.tqdm 进度条 2.fire 自动创建命令行接口(command line interfaces) a.单个函数 b.多个函数 python hello.py hello1 "beijing" 阅读全文
摘要:
小数据去重: 1.最常用的去重:set集合去重 2.数据库主键去重 大数据去重: 1.桶排序 阅读全文
摘要:
1.GAN目标函数不收敛,参数难调 2.数据集与生成集比例 3.生成四不像,模式崩塌 阅读全文