摘要:
本文已经搬运到:https://zhuanlan.zhihu.com/p/24982662 什么是计算摄像学 计算摄像学(Computational Photography)是近年来越来越受到注意的一个新的领域,在学术界早已火热。本来计算摄像学的业界应用在群众中一直没什么知名度,直到Lytro公司推 阅读全文
摘要:
基于知乎上的一个答案。问题如下: 也就是在一张照片里,已知有个长方形的物体,但是经过了透视投影,已经不再是规则的长方形,那么如何提取这个图形里的内容呢?这是个很常见的场景,比如在博物馆里看到一幅很喜欢的画,用手机找了下来,可是回家一看歪歪斜斜,脑补原画内容又觉得不对,那么就需要算法辅助来从原图里提取 阅读全文
摘要:
这篇文章也是基于知乎的一个答案。因为前天蛋疼写了个99行蛋疼版2048,所以一时兴起在知乎上搜了搜2048,结果发现了这个问题。看了看,票数最高的两个答案都是错的,所以自己推导了一下。2048的玩法就不赘述了,先来看看相关的规则,因为是Gabriele Cirulli让这个游戏火起来的,以他的源代码... 阅读全文
摘要:
基于Python和numpy,自带基于Tk最简仿原生2048配色的图形界面。文件代码行数(Physical LOC)一共99,没有统计过逻辑行数,因为是Python。本来是想写个最简单的内核然后用机器学习算策略的,可是写了几行又不想写了,索性加了个GUI做个最简版的2048,所以完全没有效率和Pyt... 阅读全文
摘要:
本文是基于知乎上的一个答案基于视频的超分辨率重建是指从许多帧连续的低分辨率图像中重建出一幅高分辨率的图像,并且这幅高分辨率的图像能够显示出单帧低分辨率图像中丢掉的细节,比如下面是一个2秒视频(176x144)中的一帧:为了方便和分辨率重建之后的图片对比,用Nearest Neighbor放大到了70... 阅读全文
摘要:
记得刚学习C++那会这个问题曾困扰过我,后来慢慢形成了不管什么时候都用一维数组的习惯,再后来知道了在一维数组中提出首列元素地址进行二维调用的办法。可从来没有细想过这个问题,最近自己写了点代码测试下,虽然还是有些不明就里,不过结果挺有意思。为了避免编译器优化过度,用的是写操作,int,测试分为不同大小... 阅读全文
摘要:
这是个挺有意思的小问题,给定一组直线(至少两条不平行),希望能找到和这组直线尽可能垂直的直线。打个比方,比如在三维空间中,如下图(forked from wiki)a和b分别是在一个平面上不平行的两条直线上,那么显而易见与a和b所在直线垂直程度最高的就是与a和b俩俩垂直的竖线,也就是叉积axb方向平... 阅读全文
摘要:
经常用Photoshop的人应该熟悉磁力套索(Magnetic Lasso)这个功能,就是人为引导下的抠图辅助工具。在研发领域一般不这么叫,通常管这种边缘提取的办法叫Intelligent Scissors或者Livewire。本来是给一个图像分割项目算法评估时的Python框架,觉得有点意思,就稍... 阅读全文
摘要:
最近参与了一个非常蛋疼的业余时间小项目:给定赛道和赛车模拟程序,求赛车跑完赛道的最快的办法。对于这个问题,我一开始的想法是:就像Google的自动驾驶一样,给定足够的训练数据,然后汽车对前方的画面做出判断决定当前时刻的驾驶策略。不过查了查文献,从游戏开发的角度,似乎一般都是用先找出赛车的最优路径,然后沿着路径驾驶就行了。我们最后采用的是后者,我负责了其中赛道产生中的一部分:近似求解最短路径(Shortest Path)和最小曲率路径(Minimum Curvature Path)。给定的输入是赛道的图像文件,用OpenCV中的边缘检测模块得到赛道的线条和中心轮廓线:一堆按顺序排列好的像素点,描 阅读全文
摘要:
这篇也是之前写在知乎上的一个答案,不过后来发现答非所问,无所谓,在这重新总结一下。线性时不变系统和信号响应是信号与系统理论中两个非常基本的观点,从线性代数的角度理解起来非常清晰。首先,来看线性代数中的一个非常基本的概念:线性映射(Linear Map)设想有个向量v,通过某种映射可以从v得到w,记为\(w=T\left( v \right)\)。如果对于任意v,w,T都满足线性代数里两条巨基本的性质:1) \(T\left( u+v \right)=T\left( u \right)+T\left( v \right)\)2) \(aT\left( v \right)=T\left( av \ 阅读全文