2018 年 4月随笔档案 - rosyYY

lesson9-小象学院cv

摘要：www.sohu.com/a/159976204_717210 生成模型：基于联合概率~共生关系判别模型：基于条件概率~因果关系生成模型之学习数据分布：1)概率密度函数估计 2)数据样本生成模型目标：训练模型，生成样本模型，学习过程是让两者接近解决问题：数据缺失-因为可以用生成模型自己生成数据阅读全文

posted @ 2018-04-29 11:08 rosyYY 阅读(232) 评论(0) 推荐(0) 编辑

tips

摘要：tensorflow tutorial https://github.com/yongyehuang/Tensorflow-Tutorial 阅读全文

posted @ 2018-04-21 07:14 rosyYY 阅读(133) 评论(0) 推荐(0) 编辑

C5-fasterrcnn-小象cv-code

摘要：1、# Path to Shapes trained weightsSHAPES_MODEL_PATH = os.path.join(ROOT_DIR, "mask_rcnn_shapes.h5") https://blog.csdn.net/u011574296/article/details/7 阅读全文

posted @ 2018-04-20 07:21 rosyYY 阅读(374) 评论(0) 推荐(0) 编辑

C4-ResNet-TF-小象cv-code

摘要：https://blog.csdn.net/chaipp0607/article/details/75577305 https://blog.csdn.net/leastsq/article/details/54374909 tf.logging.set_verbosity(tf.logging.I 阅读全文

posted @ 2018-04-18 16:56 rosyYY 阅读(302) 评论(0) 推荐(0) 编辑

lesson8-图像问答-小象cv

摘要：QA即图像问答：覆盖最全面的AI,ai完备性动态模型：不同任务需要不同模型 or 不同细分任务需要不同模型参数数据集： 1）VQA，显示图片+抽象场景；每个问题给10个不同答案；含有无图片答案（考察图片和问题的客观性）为了降低语言偏置、不均衡（language priors）-》一个问题对应2 阅读全文

posted @ 2018-04-18 11:59 rosyYY 阅读(161) 评论(0) 推荐(0) 编辑

lesson7-图像描述 -小象cv

摘要：2018-04-25朴素rcnn - 梯度消失严重LSTM长短时记忆模型，有效捕捉长时记忆包含四个神经元组：一个记忆神经元三个控制门神经元：输入、忘记、输出注意：输入调制门、输出调制门 3个输入：前一时刻的隐藏状态h、前一时刻的记忆状态c、当前时刻的输入x2个输出：当前时刻的隐含状态h，当前时刻的阅读全文

posted @ 2018-04-17 14:37 rosyYY 阅读(370) 评论(0) 推荐(0) 编辑

lesson6-图像分割-小象c

摘要：显著性检测：1）显著性物体检测-最能引起视觉注意的物体区域2)注视点预测：人类视觉注意机制视觉注意机制的两种机制：1)自底而上基于数据驱动的注意机制，如颜色、边缘 2）自上而下基于任务驱动的目标的注意机制，如认知因素钟的只是、预期、兴趣物体分割：Gragh Cuts分割~最小割最大流算法优化Gr 阅读全文

posted @ 2018-04-16 18:28 rosyYY 阅读(475) 评论(0) 推荐(0) 编辑

lesson2-cnn-fastai

摘要：%mkdir的做法glob('.jpg')np.random.permutation(图片)np.random.rename(，）#save_array：utils中，连接每个btch得到的数组#keras.predict_generatorbatches,preds = vgg.test(,)fi 阅读全文

posted @ 2018-04-14 16:43 rosyYY 阅读(158) 评论(0) 推荐(0) 编辑

lesson5-图像检测-小象cv

摘要：R-CNN: 2014，cnn为Alexnet 训练流程: 1)在imagenet上对cnn模型pre-train 2）使用所有ss生成区域对1）进行fine-tune ~softmax改为21维度 ground-truth：标记的真正的框~lou，阈值0.5~32个正样本，96个负样本 3)在2）阅读全文

posted @ 2018-04-14 10:58 rosyYY 阅读(265) 评论(0) 推荐(0) 编辑

lesson4-图像分类-小象cv

摘要：CNN网络进化：AlexNet-》VGG->GoogleNet->ResNet,深度8-》19-》22-》152GoogleNet：Lsplit-》transform-》merge，分治思想ResNeXt：在ResNet上增加cardinality基数，即通道数，残差~缓解梯度消失问题Bag of 阅读全文

posted @ 2018-04-13 08:29 rosyYY 阅读(244) 评论(0) 推荐(0) 编辑

lesson3-神经序列模型I-小象

摘要：优化目标函数： batch gradient descent：必须便利all训练数据 --》随机梯度下降，但不稳定~一个数据点就更新，快但不稳定--》minibatch，取m个随机数据点，求偏导数 why mini就ok：因为大数据是有冗余的，就像看24史-》万历十五年-》三国，稳定更新快，因为很多阅读全文

posted @ 2018-04-12 16:49 rosyYY 阅读(187) 评论(0) 推荐(0) 编辑

fast ai环境配置

摘要：https://www.jianshu.com/p/2fe22a6b0ecb https://www.jianshu.com/p/b1be2af2f2ef https://blog.csdn.net/wuyuqing1990/article/details/48167555 虚拟机 https:// 阅读全文

posted @ 2018-04-12 12:47 rosyYY 阅读(583) 评论(0) 推荐(0) 编辑

YOLO

摘要：https://blog.csdn.net/thm225679/article/details/79407619 实践》 argparse是python用于解析命令行参数和选项的标准模块，用于代替已经过时的optparse模块。argparse模块的作用是用于解析命令行参数，例如python pa 阅读全文

posted @ 2018-04-11 20:47 rosyYY 阅读(141) 评论(0) 推荐(0) 编辑

lesson2-cnn-fastai

摘要：https://www.bilibili.com/video/av10156946/index_4.html#page=4 from IPython.display import FileLinkFileLink('文件位置') 建立连接，将文件从服务器下载到电脑 import numpy as n 阅读全文

posted @ 2018-04-11 20:25 rosyYY 阅读(260) 评论(0) 推荐(0) 编辑

mask-code-python

摘要：tf.sqeeze: 给定张量输入，此操作返回相同类型的张量，并删除所有尺寸为1的尺寸。如果不想删除所有尺寸1尺寸，可以通过指定squeeze_dims来删除特定尺寸1尺寸。如果不想删除所有大小是1的维度，可以通过squeeze_dims指定。 # 't' is a tensor of shape 阅读全文

posted @ 2018-04-07 21:12 rosyYY 阅读(516) 评论(0) 推荐(0) 编辑

rcnn系列

摘要：提纲挈领 https://blog.csdn.net/linolzhang/article/details/54344350 SPP https://www.cnblogs.com/gongxijun/p/7172134.html 我们使用三层的金字塔池化层pooling，分别设置图片切分成多少块，阅读全文

posted @ 2018-04-04 20:09 rosyYY 阅读(281) 评论(0) 推荐(0) 编辑

ubuntu下配置环境

摘要：https://blog.csdn.net/zzc15806/article/details/73662491 阅读全文

posted @ 2018-04-03 15:11 rosyYY 阅读(141) 评论(0) 推荐(0) 编辑

soft-nms

摘要：https://blog.csdn.net/app_12062011/article/details/77963494 》 NMS-非极大值抑制进行后处理。通常的做法是将检测框按得分排序，然后保留得分最高的框，同时删除与该框重叠面积大于一定比例的其它框。这种贪心式方法存在如下图所示的问题：红色框阅读全文

posted @ 2018-04-03 11:49 rosyYY 阅读(261) 评论(0) 推荐(0) 编辑

lesson7cnn architecture-fastai

摘要：课程https://v.qq.com/x/page/e0398lijt8h.html 讲解： http://www.sohu.com/a/144583206_697750 resnet可以看作VGG16来使用，Resnet50中50表示容量，是resNet中最小的容量了resNet不是被设计用来和大阅读全文

posted @ 2018-04-02 18:06 rosyYY 阅读(284) 评论(0) 推荐(0) 编辑

lesson5rnns-fastai

摘要：32min 如何确定embedding个数即嵌入矩阵容量？：不确定；与文本的字数关系不大，关键是语言的复杂度和需要解决的问题类型 embedding的效果要比one hot编码的效果好阅读全文

posted @ 2018-04-02 17:37 rosyYY 阅读(122) 评论(0) 推荐(0) 编辑

lesson4Embedding-fastai

摘要：dense layer：mnist识别中，需要十组dense权重矩阵来计算这十个输出内容，conv矩阵每一个元素乘以另一个矩阵的元素并相加，得到一个值，最后加上sigmoid（softmax在二元情况下就是sihgmoid）得到一个值。什么时候需要在conv后加max pooling--未知why 阅读全文

posted @ 2018-04-02 16:38 rosyYY 阅读(266) 评论(0) 推荐(0) 编辑

lesson3 overfitting -fastai

摘要：VGG:3*3Imagenet：7*7,9*9论文中证明3*3更胜一筹，但是用多少并没有定论微调：删掉模型的中间只对最后一层微调：model.pop，就删掉了最后一层如何决定训练多少层？：·看论文上的可视化结构，清楚每一层的语义层次，哪一层的语义操作和自己的模型相关 ·试验欠拟合：使用的模型不够阅读全文

posted @ 2018-04-02 12:15 rosyYY 阅读(266) 评论(0) 推荐(0) 编辑

cell-augmented

摘要：https://zhuanlan.zhihu.com/p/33147353 https://blog.csdn.net/thm225679/article/details/79689008 https://github.com/ryanleeallred/Image_Augmentation/blo 阅读全文

posted @ 2018-04-01 18:38 rosyYY 阅读(124) 评论(0) 推荐(0) 编辑

ROI-Align解决方案

摘要：https://yq.aliyun.com/articles/558181 Mask R-CNN与Faster R-CNN相似，Faster R-CNN是two-stage的，其中第一个stage是RPN。添加一个预测分割mask的并行分支——这是一个FCN。 ROIlign Layer而不是ROI 阅读全文

posted @ 2018-04-01 15:36 rosyYY 阅读(2661) 评论(0) 推荐(0) 编辑

导航

04 2018 档案