摘要:
因为博士的研究方向最近确定下来会是图像检索相关(希望不会再有变化了),故而决定从最基础的Human Behavior开始着手,首先弄明白人在进行信息获取(Information seek)过程中具体的行为是怎样,会特别是对于网络信息获取过程中的倾向性选择是如何的,评判的标准是怎样的。1. 人类在进行信息搜索的过程中,满足“最省事原理”(principle of least effor),一旦找到还可以接受的结果后,信息搜索的行为就会离开停止。这也是目前search engine的基本原理,满足人类search寻找最相关信息的需求。注意:最相关信息是可以接受的结果的一部分,但不是全部,例如当有相 阅读全文
摘要:
本文转载了文章(沈阳的博客),目的在于记录自己重复过程中遇到的问题,和更多的人分享讨论。程序包:猛戳我物体分类物体分类是计算机视觉中一个很有意思的问题,有一些已经归类好的图片作为输入,对一些未知类别的图片进行预测。下面会说明我使用OpenCV实现的两种方法,第一种方法是经典的bag of words的实现;第二种方法基于第一种方法,但使用的分类方法有所不同。在此之前,有必要说明一下输入的格式,输入训练数据文件夹,和CalTech 101的组织类似。如下所示,每一类图片都放在一个文件夹里,文件夹的名字就是类别的名字,不需要特别的说明文件。test/ category1/ im... 阅读全文
摘要:
主要参考维基百科Bag of Word在DLP领域里,bow(bag of word)是一个稀疏的向量,向量的每个元素记录词的出现次数,相当于对每篇文章都关于词典做词的直方图统计。同样的道理用在computer vision领域,图像由一些基础的特征构成,每幅图像就是对这些特征的一个统计分布,在做图像分类时会假设相似图像他们的特征统计分布也符合一定的模型。于是从这句话里就可以把以bow模型的图像分类问题分解成以下几步:1.1 特征检测; 1.2 特征描述;1.3码本生成(bow向量)2.1 生成模型(Generative model)2.2 判别模型(Discriminate model)1. 阅读全文