关于人群分析与行人识别的讲座

今天上午实验室请来了约翰霍普金斯大学的一个教授来做讲座,讲座主要内容是人群分析,当然也讲了些其他东西。

不得不说听这个疑似印度大叔的英语还是挺练听力的,语速飞快,还好讲的是我熟悉的领域,虽然有的地方听的半懂不懂,但基本意思还是知道的

我印象比较深刻的有:

行人检测,现在很多监控摄像头都是在屋顶屋檐上,因此拍到的图像也好视频也好,很多都是拍到人的头顶或者斜上方的角度,这种情况人脸是基本看不见的,基于人脸的检测就很困难,另外一方面是现在很多行人检测都是基于穿着服饰等外貌的,而一旦人进入室内换了衣服再出来,算法必然失效。考虑到这两点苦难,有什么办法能弥补?我们讲,只看头,基本很难分辨人的,因为发型虽然不像衣服换的那么勤,但是还是可能会有变化的,那么从头部还能有什么信息呢,你绝对想不到他想出了啥,他认为人的那个发旋很可能具有分辨性。。。。。其实细细一想,貌似还挺有道理的。我个人很期待他们后续的工作😂。

人群检测,人群检测主要还是在于计算人群当中人的数量,就是给一张照片,里面是在某个场景下的一个人群,一般视角都比较远,任务是给出照片里有多少人,当前比较火的是用所谓的heat image,就是把这张照片转化成一个反映人群密度的热度图,人相对密度大的地方,图的颜色就深。他的工作也很有启发性,他说,他们发现近些年的一些算法都有一个缺点,那就是在在计算人数时,密度大的,也就是人特别多的图,那些算法不精确饿的原因在于总是少数,反过来,人比较稀疏的图,算法倾向于多数。那么一个直接的想法就是,我能不能先把图分成人多和人少的,然后再分别回归呢?这是一个改进,后来又发现,一张图里,人的密度分布时很不均匀的,有些地方全是背景,人就很稀疏,因此,把这个思想进一步应用到局部图像区域上,对图像区域也分成人多和人少的,再计算heat map。

另一个角度的改进来源于损失函数,上面提到,这些方法都是先由原始图像生成一个热度图像,既然是一个图像--图像的任务,那么生成对抗网络是不是就可以用了呢,而且可以预先分析一下用了对抗损失,效果会不会变好,实际上,考虑到对抗损失更倾向于产生边界清晰的图像,因此结果必然更好。

 

这就是今天讲座我印象深刻的点,可以说是非常有启发性了。

 

posted @ 2018-08-24 19:34  淡定的伊总  阅读(444)  评论(0编辑  收藏  举报