摘要:
这是篇仅一页的poster,介绍了作者关于在贫困地区的网吧提供"microwork"(文中采用的是打字)的调查结果,实验是在印度的两个城市和肯尼亚的一个城市进行。 阅读全文
摘要:
本文介绍了一种基于众包的翻译流程,通过redundancy、post edit、rank等手段,来获得质量接近专业水准的译文。作者Omar Zaidan是Johns Hopkins University的博士生。 阅读全文
摘要:
本文提出了一种基于众包的翻译流程,分为三个步骤,依次为:word translation, assisted sentence translation and translation synthesis. 前一个步骤的输出均做为后一个步骤的输入。 阅读全文
摘要:
纵包网站上罗列的任务数量已经越来越多了,对于worker来说,面临着一个问题:如何快速有效的找到一个合适的任务? 本文提出了一种为worker推荐合适任务的方法,主要基于该worker过去的任务偏好和表现。 阅读全文
摘要:
这篇文章是TAUS的一篇报告,主要介绍了:collaborative技术在翻译领域的应用的几种形式、协同翻译面临的一些共同问题。 阅读全文
摘要:
这篇四页的短文提出了一个概念原型Qurk:具有类似SQL的查询系统,具体任务经分解、包装后发布到MTurk上。文中对Qurk的描述:"a novel query system for managing these workflows, allowing MTurk-style processing of relational databases"。 阅读全文
摘要:
近些年来兴起的crowdsourcing系统(以下简称“CS系统”),是解决“human-powered solving of large scale problems”的有效方式。
CS系统依赖于大量成本低廉的劳动力,对于他们所提交的结果,如果保证质量是一个至关重要的问题。本文要解决的问题可以表述为:“一个工作最少分发给几个worker,可以保证结果整体的有效性?”。 阅读全文
摘要:
这篇短文提到了Web2.0环境下(如crowdsourcing),SOA面临的一个新问题(同时也是机会):比如在crowdsourcing场景中,部分service可能是由人来完成的(传统环境中是机器执行的web serivce)。 阅读全文
摘要:
介绍了在设计早期阶段举行“Collaborative design session”的益处以及确保这类session成功的10条基本原则。 阅读全文
摘要:
这是第三届HCOMP, 前两届都是傍着KDD, 这次傍了AAAI。时间:August 8, 2011. 地点:San Francisco, CA. 收录论文情况:一份technical report, 32篇论文(其中16篇是poster) 阅读全文
摘要:
这篇论文采用“论文速读”模式进行阅读。问题背景:苏格兰国家图书馆在08/09这一年新入了130000本出版物,其中只有60%被编了书目(只有被编了书目的出版物才能被查找到)。
采用的办法:在mTurk上发表任务,将扫描出来的图片放上去,以crowdsourcing的方式进行翻译。 阅读全文
摘要:
Human Computation Workshop(HCOMP2010), July 25, 2010 ,Washington, D.C., USA .
收录论文情况:共有4个session, 包括: Invited Talk(1篇), Market design(3篇), Human Computation in practice(10 篇), Task and process design(5篇),合计19篇(包括长文和poster). 阅读全文
摘要:
这篇文章是关于第一届human computation workshop的一份报告(Ipeirotis是这个workshop的Organizing Committee),主要就是介绍了这个workshop的papers、demos、posters,以及总体的情况。 阅读全文
摘要:
作者Alex Quinn,2002年毕业于华盛顿大学,目前是University of Maryland(UMD)的博士生,研究方向是human computer interaction,毕业论文题目为"Crowdsourcing and human computation for decision support"。本文先介绍了背景,然后讨论了hc的定义,并与相关技术进行区分和比较,之后重点提出了针对hc系统的分类体系,并说明了如何根据所提出的分类体系来寻找新的研究点。 阅读全文
摘要:
【来信】
玉泉老博,
你好,我一直在博客园关注你的博客,我是做hidden database方向的博士学生,现在在澳门大学。想请教你下读博士的经验。
我很羡慕你可以学出很专业的review,请问你读paper是怎么训练的呢?
我读paper就很慢,看完就忘,而且忙着coding的时候也会忘记读paper。。。
我也很想把我这个领域的paper全都读一遍,但是有点不知道怎么安排计划。。。
真的很希望你可以分享些经验。
XX 阅读全文
摘要:
L Von Ahn是human computation领域的开创者,为推广这一领域自然不遗余力,这篇是他在DAC09上介绍human computation的的短文(session: computation in the post-turing era)。虽是一篇只有两页的poster, 但在两年多的时间里却被引用达88次之多, 足见有相当的影响力,几乎是此领域论文必引之物。
这篇短文无非就是介绍了一下背景、概念,以及两个较成功的案例。 阅读全文
摘要:
综述文章"A Survey of Software Refactoring"读书笔记的第二部分 阅读全文
摘要:
这篇论文的作者Tom Mens1999年获得博士学位,现在是比利时蒙斯大学(University of Mons)的full professor,主要研究“formal foundations and automated tool support for software engineering”(特别是software evolution等),论著颇丰。在Google Scholar里搜“refactoring”,这篇论文排在第五位,且出版时间相对较迟,应该是该方向截止目前最新的一篇综述。
这篇综述针对软件重构(software refactoring),篇幅13页半,引用了111篇文献。全文分为8个部分。 阅读全文
摘要:
偶尔搜到“23种经典设计模式UML类图汇总”,顺着链接过去就找到了REFCARDZ。这个网站提供IT开发技术方面各类"cheat sheet"(比如对于设计模式,23种Gof的模式被编成很精简的格式),适合以前学过的人不时地翻阅复习或快速查找技术要点(但可能不适合作为新手的入门材料),其中有些cheat sheet还是大师级人物写的。 阅读全文
摘要:
CAPTCHA(“Completely Automated Public Turing test to tell Computers and Human Apart”)这个称谓最早是在2000年由CMU的Luis von Ahn, Manuel Blum等人提出,中文直译为“全自动区分计算机和人类的图灵测试”,俗称“验证码”,现在是登陆注册时的必备步骤。
最初的CAPTCHA的图片由机器生成,控制程序知道正确答案,其发挥的功效纯粹就是为了防止机器自动注册;而reCAPTCHA则赋予了这个过程更加深远的意义,除了能更好区分人和机器的作用,还能“顺便”为文献数字化做出贡献 阅读全文