随笔分类 -  计算视觉

摘要:同步自我的知乎专栏文章:https://zhuanlan.zhihu.com/p/32135185 从Slerp说起 ICLR'2017的投稿里,有一篇很有意思但被拒掉的投稿《Sampling Generative Networks》 by Tom White。文章比较松散地讲了一些在latent 阅读全文
posted @ 2017-12-26 21:07 達聞西 阅读(7226) 评论(0) 推荐(2) 编辑
摘要:模型融合 有的时候我们手头可能有了若干个已经训练好的模型,这些模型可能是同样的结构,也可能是不同的结构,训练模型的数据可能是同一批,也可能不同。无论是出于要通过ensemble提升性能的目的,还是要设计特殊作用的网络,在用Caffe做工程时,融合都是一个常见的步骤。 比如考虑下面的场景,我们有两个模 阅读全文
posted @ 2017-04-09 12:38 達聞西 阅读(8275) 评论(31) 推荐(1) 编辑
摘要:同步自我的知乎专栏:https://zhuanlan.zhihu.com/p/26122612 上篇文章 瞎谈CNN:通过优化求解输入图像 - 知乎专栏 中提到过对抗样本,这篇算是针对对抗样本的一个小小扩充:用Fast Gradient Sign方法在Caffe中生成对抗样本。 本文代码的完整例子可 阅读全文
posted @ 2017-04-01 19:17 達聞西 阅读(3558) 评论(0) 推荐(1) 编辑
摘要:本文同步自我的知乎专栏: From Beijing with Love 机器学习和优化问题 很多机器学习方法可以归结为优化问题,对于一个参数模型,比如神经网络,用来表示的话,训练模型其实就是下面的参数优化问题: 其中L是loss function,比如神经网络中分类常用的cross-entropy。 阅读全文
posted @ 2017-03-11 08:52 達聞西 阅读(1938) 评论(0) 推荐(2) 编辑
摘要:2017 02 22,Update: 鉴于这篇文章反馈很多,有部分读者照着这篇文章步骤的读者跑不通来咨询,因为这篇里代码是分散写的很容易漏掉步骤,如果完全按照文章是可以重现的,如果还是不能重现,有个简化后的例子,全部代码在这里: "https://github.com/frombeijingwith 阅读全文
posted @ 2016-03-30 19:20 達聞西 阅读(26465) 评论(52) 推荐(5) 编辑
摘要:基于知乎上的一个答案。问题如下: 也就是在一张照片里,已知有个长方形的物体,但是经过了透视投影,已经不再是规则的长方形,那么如何提取这个图形里的内容呢?这是个很常见的场景,比如在博物馆里看到一幅很喜欢的画,用手机找了下来,可是回家一看歪歪斜斜,脑补原画内容又觉得不对,那么就需要算法辅助来从原图里提取 阅读全文
posted @ 2015-01-17 22:19 達聞西 阅读(47701) 评论(11) 推荐(11) 编辑
摘要:本文是基于知乎上的一个答案基于视频的超分辨率重建是指从许多帧连续的低分辨率图像中重建出一幅高分辨率的图像,并且这幅高分辨率的图像能够显示出单帧低分辨率图像中丢掉的细节,比如下面是一个2秒视频(176x144)中的一帧:为了方便和分辨率重建之后的图片对比,用Nearest Neighbor放大到了70... 阅读全文
posted @ 2014-11-14 20:02 達聞西 阅读(7920) 评论(5) 推荐(4) 编辑
摘要:这是个挺有意思的小问题,给定一组直线(至少两条不平行),希望能找到和这组直线尽可能垂直的直线。打个比方,比如在三维空间中,如下图(forked from wiki)a和b分别是在一个平面上不平行的两条直线上,那么显而易见与a和b所在直线垂直程度最高的就是与a和b俩俩垂直的竖线,也就是叉积axb方向平... 阅读全文
posted @ 2014-05-26 18:18 達聞西 阅读(2784) 评论(2) 推荐(1) 编辑
摘要:经常用Photoshop的人应该熟悉磁力套索(Magnetic Lasso)这个功能,就是人为引导下的抠图辅助工具。在研发领域一般不这么叫,通常管这种边缘提取的办法叫Intelligent Scissors或者Livewire。本来是给一个图像分割项目算法评估时的Python框架,觉得有点意思,就稍... 阅读全文
posted @ 2014-05-13 11:38 達聞西 阅读(5158) 评论(3) 推荐(9) 编辑