2013年4月6日
摘要: http://www.phash.org/ 阅读全文
posted @ 2013-04-06 23:18 Hanson-jun 阅读(167) 评论(0) 推荐(0) 编辑
摘要: Topic: Perceptual Hash: Average -- How to compare imagesFrom: http://forums.pixeloutlaw.smakweb.com/index.php?topic=13.0A Perceptual Hash is a hash value, generated from any input image. They create a distinct (but not unique) fingerprint for an image. The purpose of these hashes is to allow us to c 阅读全文
posted @ 2013-04-06 23:00 Hanson-jun 阅读(337) 评论(0) 推荐(0) 编辑
  2013年4月5日
摘要: 该工程的文章发表在2012ECCV,主要工作包括:对现有的二进制描述符和探测器的多种组合进行了评估,并制定了评估标准,包括测试数据集,可用于新描述符性能的测试。工程网址如下:http://www.cs.unc.edu/~jheinly/feature-evaluation.html 阅读全文
posted @ 2013-04-05 12:58 Hanson-jun 阅读(545) 评论(0) 推荐(0) 编辑
  2012年10月10日
摘要: 搜索质量评估是搜索技术研究的基础性工作,也是核心工作之一。评价(Metrics)在搜索技术研发中扮演着重要角色,以至于任何一种新方法与他们的评价方式是融为一体的。搜索引擎结果的好坏与否,体现在业界所称的在相关性(Relevance)上。相关性的定义包括狭义和广义两方面,狭义的解释是:检索结果和用户查询的相关程度。而从广义的层面,相关性可以理解为为用户查询的综合满意度。直观的来看,从用户进入搜索框的那一刻起,到需求获得满足为止,这之间经历的过程越顺畅,越便捷,搜索相关性就越好。本文总结业界常用的相关性评价指标和量化评价方法。供对此感兴趣的朋友参考。Cranfield评价体系A Cranfield 阅读全文
posted @ 2012-10-10 16:24 Hanson-jun 阅读(7549) 评论(0) 推荐(3) 编辑
摘要: 在信息检索、分类体系中,有一系列的指标,搞清楚这些指标对于评价检索和分类性能非常重要,因此最近根据网友的博客做了一个汇总。准确率、召回率、F1信息检索、分类、识别、翻译等领域两个最基本指标是召回率(Recall Rate)和准确率(Precision Rate),召回率也叫查全率,准确率也叫查准率,概念公式: 召回率(Recall) = 系统检索到的相关文件 / 系统所有相关的文件总数 准确率(Precision) = 系统检索到的相关文件 / 系统所有检索到的文件总数图示表示如下:注意:准确率和召回率是互相影响的,理想情况下肯定是做到两者都高,但是一般情况下准确率高、召回率就低,召... 阅读全文
posted @ 2012-10-10 16:23 Hanson-jun 阅读(1725) 评论(0) 推荐(1) 编辑
摘要: 正确率、召回率和F值是在鱼龙混杂的环境中,选出目标的重要评价指标。 不妨看看这些指标的定义先:正确率 = 正确识别的个体总数 / 识别出的个体总数召回率 = 正确识别的个体总数 / 测试集中存在的个体总数F值 = 正确率 * 召回率 * 2 / (正确率 + 召回率) 不妨举这样一个例子:某池塘有1400条鲤鱼,300只虾,300只鳖。现在以捕鲤鱼为目的。Seaeagle撒一大网,逮着了700条鲤鱼,200只虾,100只鳖。那么,这些指标分别如下:正确率 = 700 / (700 + 200 + 100) = 70%召回率 = 700 / 1400 = 50%F值 = 70% * 50% * 阅读全文
posted @ 2012-10-10 16:12 Hanson-jun 阅读(362) 评论(0) 推荐(0) 编辑
摘要: 最近一直在做相关推荐方面的研究与应用工作,召回率与准确率这两个概念偶尔会遇到,知道意思,但是有时候要很清晰地向同学介绍则有点转不过弯来。召回率和准确率是数据挖掘中预测、互联网中的搜索引擎等经常涉及的两个概念和指标。召回率:Recall,又称“查全率”——还是查全率好记,也更能体现其实质意义。准确率:Precision,又称“精度”、“正确率”。以检索为例,可以把搜索情况用下图表示:相关不相关检索到AB未检索到CDA:检索到的,相关的(搜到的也想要的)B:检索到的,但是不相关的(搜到的但没用的)C:未检索到的,但却是相关的(没搜到,然而实际上想要的)D:未检索到的,也不相关的(没搜到也没用的)如 阅读全文
posted @ 2012-10-10 16:02 Hanson-jun 阅读(562) 评论(0) 推荐(0) 编辑
  2012年9月30日
摘要: 搞IT的就是修电脑的,做软件的就是写代码的。后一句可能更对一些,因为学校是这么教的,开发工作中的确也是这么在做。然而,新手在写代码,牛人也在写代码,他们之间有什么区别?为何新人老手相互之间不理解?新手如何成长为牛人,老手如何百尺竿头更进一步?BDD、TDD为何兴起,又为何难以推行?软件研发公司的写代码能力提升为什么这么难?写代码的三重境界记录了关于写代码的一些思考。1. 写代码的三重境界1.1 写代码三重境界之第一重境界是见山是山。对第一重境界的人来看,写代码就是软件开发的全部,软件开发人员的工作就是写代码,如果没有在写代码,软件开发人员就没有在工作。他们会第一时间投入到代码编写工作中,编写的 阅读全文
posted @ 2012-09-30 21:14 Hanson-jun 阅读(398) 评论(0) 推荐(0) 编辑
  2012年9月29日
摘要: 从cvchina上看到的,转载自demonstrate 的 blog自己稍作补充。这里搜集了一些常见的和 machine learning 相关的网站,按照 topic 来分。Active Learninghttp://active-learning.net/,这里包括了关于Active Learning理论以及应用的一些文章,特别是那篇Survey。 Transfer Learninghttp://www.cse.ust.hk/TL/,包括经典的论文以及附带有源码,很方便。 Gaussian Processeshttp://www.gaussianprocess.org 包括相关的书籍(有C 阅读全文
posted @ 2012-09-29 17:34 Hanson-jun 阅读(303) 评论(0) 推荐(0) 编辑
摘要: 关于computer vision的会议及vision guys注:我上次在转载Zhihua Zhou的帖子时候补充说明了cv的会议,现在扩展成一篇长文. 众所周知, computer vision(cv) 存在ICCV/CVPR/ECCV三个顶级会议, 它们档次差不多,都应该在一流会议行列, 没有必要给个高下. 有些us的人认为ICCV/CVPR略好于ECCV,而欧洲人大都认为ICCV/ECCV略好于CVPR, 某些英国的人甚至认为BMVC好于CVPR.简言之, 三个会议差不多, 各有侧重和偏好. 笔者就个人经验浅谈三会异同, 以供大家参考和讨论. 三者乃cv领域的旗舰和风向标,其oral 阅读全文
posted @ 2012-09-29 17:11 Hanson-jun 阅读(308) 评论(0) 推荐(0) 编辑