04 2018 档案
lesson9-小象学院cv
摘要:www.sohu.com/a/159976204_717210 生成模型:基于联合概率~共生关系判别模型:基于条件概率~因果关系 生成模型之学习数据分布:1)概率密度函数估计 2)数据样本生成 模型目标:训练模型,生成样本模型,学习过程是让两者接近解决问题: 数据缺失-因为可以用生成模型自己生成数据
阅读全文
C5-fasterrcnn-小象cv-code
摘要:1、# Path to Shapes trained weightsSHAPES_MODEL_PATH = os.path.join(ROOT_DIR, "mask_rcnn_shapes.h5") https://blog.csdn.net/u011574296/article/details/7
阅读全文
C4-ResNet-TF-小象cv-code
摘要:https://blog.csdn.net/chaipp0607/article/details/75577305 https://blog.csdn.net/leastsq/article/details/54374909 tf.logging.set_verbosity(tf.logging.I
阅读全文
lesson8-图像问答-小象cv
摘要:QA即图像问答:覆盖最全面的AI,ai完备性 动态模型:不同任务需要不同模型 or 不同细分任务需要不同模型参数 数据集: 1)VQA,显示图片+抽象场景;每个问题给10个不同答案;含有无图片答案(考察图片和问题的客观性) 为了降低语言偏置、不均衡(language priors)-》一个问题对应2
阅读全文
lesson7-图像描述 -小象cv
摘要:2018-04-25朴素rcnn - 梯度消失严重LSTM长短时记忆模型,有效捕捉长时记忆包含四个神经元组:一个记忆神经元三个控制门神经元:输入、忘记、输出 注意:输入调制门、输出调制门 3个输入:前一时刻的隐藏状态h、前一时刻的记忆状态c、当前时刻的输入x2个输出:当前时刻的隐含状态h,当前时刻的
阅读全文
lesson6-图像分割-小象c
摘要:显著性检测:1)显著性物体检测-最能引起视觉注意的物体区域2)注视点预测:人类视觉注意机制 视觉注意机制的两种机制:1)自底而上基于数据驱动的注意机制,如颜色、边缘 2)自上而下基于任务驱动的目标的注意机制,如认知因素钟的只是、预期、兴趣 物体分割:Gragh Cuts分割~最小割最大流算法优化Gr
阅读全文
lesson2-cnn-fastai
摘要:%mkdir的做法glob('.jpg')np.random.permutation(图片)np.random.rename(,)#save_array:utils中,连接每个btch得到的数组#keras.predict_generatorbatches,preds = vgg.test(,)fi
阅读全文
lesson5-图像检测-小象cv
摘要:R-CNN: 2014,cnn为Alexnet 训练流程: 1)在imagenet上对cnn模型pre-train 2)使用所有ss生成区域对1)进行fine-tune ~softmax改为21维度 ground-truth:标记的真正的框~lou,阈值0.5~32个正样本,96个负样本 3)在2)
阅读全文
lesson4-图像分类-小象cv
摘要:CNN网络进化:AlexNet-》VGG->GoogleNet->ResNet,深度8-》19-》22-》152GoogleNet:Lsplit-》transform-》merge,分治思想ResNeXt:在ResNet上增加cardinality基数,即通道数,残差~缓解梯度消失问题Bag of
阅读全文
lesson3-神经序列模型I-小象
摘要:优化目标函数: batch gradient descent:必须便利all训练数据 --》随机梯度下降,但不稳定~一个数据点就更新,快但不稳定--》minibatch,取m个随机数据点,求偏导数 why mini就ok:因为大数据是有冗余的,就像看24史-》万历十五年-》三国,稳定更新快,因为很多
阅读全文
fast ai环境配置
摘要:https://www.jianshu.com/p/2fe22a6b0ecb https://www.jianshu.com/p/b1be2af2f2ef https://blog.csdn.net/wuyuqing1990/article/details/48167555 虚拟机 https://
阅读全文
YOLO
摘要:https://blog.csdn.net/thm225679/article/details/79407619 实践 》 argparse是python用于解析命令行参数和选项的标准模块,用于代替已经过时的optparse模块。argparse模块的作用是用于解析命令行参数,例如python pa
阅读全文
lesson2-cnn-fastai
摘要:https://www.bilibili.com/video/av10156946/index_4.html#page=4 from IPython.display import FileLinkFileLink('文件位置') 建立连接,将文件从服务器下载到电脑 import numpy as n
阅读全文
mask-code-python
摘要:tf.sqeeze: 给定张量输入,此操作返回相同类型的张量,并删除所有尺寸为1的尺寸。 如果不想删除所有尺寸1尺寸,可以通过指定squeeze_dims来删除特定尺寸1尺寸。如果不想删除所有大小是1的维度,可以通过squeeze_dims指定。 # 't' is a tensor of shape
阅读全文
rcnn系列
摘要:提纲挈领 https://blog.csdn.net/linolzhang/article/details/54344350 SPP https://www.cnblogs.com/gongxijun/p/7172134.html 我们使用三层的金字塔池化层pooling,分别设置图片切分成多少块,
阅读全文
ubuntu下配置环境
摘要:https://blog.csdn.net/zzc15806/article/details/73662491
阅读全文
soft-nms
摘要:https://blog.csdn.net/app_12062011/article/details/77963494 》 NMS-非极大值抑制进行后处理。 通常的做法是将检测框按得分排序,然后保留得分最高的框,同时删除与该框重叠面积大于一定比例的其它框。这种贪心式方法存在如下图所示的问题: 红色框
阅读全文
lesson7cnn architecture-fastai
摘要:课程https://v.qq.com/x/page/e0398lijt8h.html 讲解: http://www.sohu.com/a/144583206_697750 resnet可以看作VGG16来使用,Resnet50中50表示容量,是resNet中最小的容量了resNet不是被设计用来和大
阅读全文
lesson5rnns-fastai
摘要:32min 如何确定embedding个数即嵌入矩阵容量?:不确定;与文本的字数关系不大,关键是语言的复杂度和需要解决的问题类型 embedding的效果要比one hot编码的效果好
阅读全文
lesson4Embedding-fastai
摘要:dense layer:mnist识别中,需要十组dense权重矩阵来计算这十个输出内容,conv矩阵每一个元素乘以另一个矩阵的元素并相加,得到一个值,最后加上sigmoid(softmax在二元情况下就是sihgmoid)得到一个值。 什么时候需要在conv后加max pooling--未知why
阅读全文
lesson3 overfitting -fastai
摘要:VGG:3*3Imagenet:7*7,9*9论文中证明3*3更胜一筹,但是用多少并没有定论微调:删掉模型的中间只对最后一层微调:model.pop,就删掉了最后一层 如何决定训练多少层?:·看论文上的可视化结构,清楚每一层的语义层次,哪一层的语义操作和自己的模型相关 ·试验 欠拟合:使用的模型不够
阅读全文
cell-augmented
摘要:https://zhuanlan.zhihu.com/p/33147353 https://blog.csdn.net/thm225679/article/details/79689008 https://github.com/ryanleeallred/Image_Augmentation/blo
阅读全文
ROI-Align解决方案
摘要:https://yq.aliyun.com/articles/558181 Mask R-CNN与Faster R-CNN相似,Faster R-CNN是two-stage的,其中第一个stage是RPN。添加一个预测分割mask的并行分支——这是一个FCN。 ROIlign Layer而不是ROI
阅读全文