玉泉老博 - 博客园

2012年5月5日

[论文笔记] Exploring microwork opportunities through cybercafés (ACM DEV, 2012)

摘要：这是篇仅一页的poster，介绍了作者关于在贫困地区的网吧提供"microwork"（文中采用的是打字）的调查结果，实验是在印度的两个城市和肯尼亚的一个城市进行。阅读全文

posted @ 2012-05-05 14:10 玉泉老博阅读(220) 评论(0) 推荐(0) 编辑

2012年5月3日

[论文笔记] Crowdsourcing Translation: Professional Quality from Non-Professionals (ACL, 2011)

摘要：本文介绍了一种基于众包的翻译流程，通过redundancy、post edit、rank等手段，来获得质量接近专业水准的译文。作者Omar Zaidan是Johns Hopkins University的博士生。阅读全文

posted @ 2012-05-03 20:18 玉泉老博阅读(769) 评论(0) 推荐(0) 编辑

2012年4月15日

[论文笔记] Collaborative workflow for crowdsourcing translation (CSCW, 2012)

摘要：本文提出了一种基于众包的翻译流程，分为三个步骤，依次为：word translation, assisted sentence translation and translation synthesis. 前一个步骤的输出均做为后一个步骤的输入。阅读全文

posted @ 2012-04-15 15:39 玉泉老博阅读(681) 评论(0) 推荐(0) 编辑

2012年3月30日

[论文笔记] Task Matching in Crowdsourcing (iThings & CPSCom, 2011)

摘要：纵包网站上罗列的任务数量已经越来越多了，对于worker来说，面临着一个问题：如何快速有效的找到一个合适的任务？本文提出了一种为worker推荐合适任务的方法，主要基于该worker过去的任务偏好和表现。阅读全文

posted @ 2012-03-30 16:18 玉泉老博阅读(658) 评论(2) 推荐(0) 编辑

2012年3月28日

[文章笔记] Wanted: Best Practices for Collaborative Translation (2011)

摘要：这篇文章是TAUS的一篇报告，主要介绍了：collaborative技术在翻译领域的应用的几种形式、协同翻译面临的一些共同问题。阅读全文

posted @ 2012-03-28 08:52 玉泉老博阅读(305) 评论(0) 推荐(0) 编辑

2012年3月26日

[论文笔记] Crowdsourced Databases: Query Processing with People (CIDR, 2011)

摘要：这篇四页的短文提出了一个概念原型Qurk：具有类似SQL的查询系统，具体任务经分解、包装后发布到MTurk上。文中对Qurk的描述："a novel query system for managing these workflows, allowing MTurk-style processing of relational databases"。阅读全文

posted @ 2012-03-26 10:52 玉泉老博阅读(3707) 评论(0) 推荐(0) 编辑

2012年3月24日

[论文笔记] Budget-optimal crowdsourcing using low-rank matrix approximations (Allerton, 2011)

摘要：近些年来兴起的crowdsourcing系统（以下简称“CS系统”），是解决“human-powered solving of large scale problems”的有效方式。 CS系统依赖于大量成本低廉的劳动力，对于他们所提交的结果，如果保证质量是一个至关重要的问题。本文要解决的问题可以表述为：“一个工作最少分发给几个worker，可以保证结果整体的有效性？”。阅读全文

posted @ 2012-03-24 20:04 玉泉老博阅读(719) 评论(1) 推荐(0) 编辑

2012年2月5日

[论文泛读] Integrating human-services using WebComposition/UIX (PDT, 2011)

摘要：这篇短文提到了Web2.0环境下（如crowdsourcing)，SOA面临的一个新问题（同时也是机会）：比如在crowdsourcing场景中，部分service可能是由人来完成的（传统环境中是机器执行的web serivce）。阅读全文

posted @ 2012-02-05 12:13 玉泉老博阅读(342) 评论(0) 推荐(0) 编辑

2012年2月4日

[文章摘录] Strategies for Early-Stage Collaborative Design (IEEE Software, 2012)

摘要：介绍了在设计早期阶段举行“Collaborative design session”的益处以及确保这类session成功的10条基本原则。阅读全文

posted @ 2012-02-04 12:30 玉泉老博阅读(320) 评论(0) 推荐(0) 编辑

2011年12月23日

[论文收集] HCOMP 2011概况及收录论文

摘要：这是第三届HCOMP，前两届都是傍着KDD，这次傍了AAAI。时间：August 8, 2011. 地点：San Francisco, CA. 收录论文情况：一份technical report, 32篇论文（其中16篇是poster）阅读全文

posted @ 2011-12-23 09:57 玉泉老博阅读(675) 评论(0) 推荐(0) 编辑

2011年12月22日

[论文速读] Towards crowdsourcing translation tasks in library cataloguing, a pilot study (DEST, 2010)

摘要：这篇论文采用“论文速读”模式进行阅读。问题背景：苏格兰国家图书馆在08/09这一年新入了130000本出版物，其中只有60%被编了书目（只有被编了书目的出版物才能被查找到）。采用的办法：在mTurk上发表任务，将扫描出来的图片放上去，以crowdsourcing的方式进行翻译。阅读全文

posted @ 2011-12-22 11:16 玉泉老博阅读(482) 评论(0) 推荐(0) 编辑

2011年12月21日

[信息收集] HCOMP 2010概况及收录论文

摘要： Human Computation Workshop(HCOMP2010), July 25, 2010 ,Washington, D.C., USA . 收录论文情况：共有4个session，包括： Invited Talk(1篇）, Market design(3篇), Human Computation in practice(10 篇), Task and process design(5篇)，合计19篇（包括长文和poster）. 阅读全文

posted @ 2011-12-21 16:31 玉泉老博阅读(519) 评论(0) 推荐(0) 编辑

2011年12月20日

[阅读笔记] A Report on the Human Computation Workshop (HCOMP, 2009)

摘要：这篇文章是关于第一届human computation workshop的一份报告（Ipeirotis是这个workshop的Organizing Committee），主要就是介绍了这个workshop的papers、demos、posters，以及总体的情况。阅读全文

posted @ 2011-12-20 16:04 玉泉老博阅读(462) 评论(0) 推荐(0) 编辑

2011年12月19日

[论文笔记] Human computation: a survey and taxonomy of a growing field (CHI, 2011)

摘要：作者Alex Quinn，2002年毕业于华盛顿大学，目前是University of Maryland(UMD)的博士生，研究方向是human computer interaction，毕业论文题目为"Crowdsourcing and human computation for decision support"。本文先介绍了背景，然后讨论了hc的定义，并与相关技术进行区分和比较，之后重点提出了针对hc系统的分类体系，并说明了如何根据所提出的分类体系来寻找新的研究点。阅读全文

posted @ 2011-12-19 19:35 玉泉老博阅读(596) 评论(0) 推荐(0) 编辑

2011年12月18日

[博友互动] 博士在读学生请教问题（20111216来信，关于论文阅读和管理）

摘要：【来信】玉泉老博，你好，我一直在博客园关注你的博客，我是做hidden database方向的博士学生，现在在澳门大学。想请教你下读博士的经验。我很羡慕你可以学出很专业的review，请问你读paper是怎么训练的呢？我读paper就很慢，看完就忘，而且忙着coding的时候也会忘记读paper。。。我也很想把我这个领域的paper全都读一遍，但是有点不知道怎么安排计划。。。真的很希望你可以分享些经验。 XX 阅读全文

posted @ 2011-12-18 11:03 玉泉老博阅读(503) 评论(0) 推荐(0) 编辑

2011年12月17日

[论文笔记] Human Computation (DAC, 2009)

摘要： L Von Ahn是human computation领域的开创者，为推广这一领域自然不遗余力，这篇是他在DAC09上介绍human computation的的短文（session: computation in the post-turing era）。虽是一篇只有两页的poster, 但在两年多的时间里却被引用达88次之多, 足见有相当的影响力，几乎是此领域论文必引之物。这篇短文无非就是介绍了一下背景、概念，以及两个较成功的案例。阅读全文

posted @ 2011-12-17 16:21 玉泉老博阅读(401) 评论(0) 推荐(0) 编辑

2011年12月15日

[论文笔记] A Survey of Software Refactoring（TOSE, 2004）第二部分

摘要：综述文章"A Survey of Software Refactoring"读书笔记的第二部分阅读全文

posted @ 2011-12-15 09:26 玉泉老博阅读(442) 评论(0) 推荐(0) 编辑

2011年12月14日

[论文笔记] A Survey of Software Refactoring（TOSE, 2004）第一部分

摘要：这篇论文的作者Tom Mens1999年获得博士学位，现在是比利时蒙斯大学（University of Mons）的full professor，主要研究“formal foundations and automated tool support for software engineering”（特别是software evolution等），论著颇丰。在Google Scholar里搜“refactoring”，这篇论文排在第五位，且出版时间相对较迟，应该是该方向截止目前最新的一篇综述。这篇综述针对软件重构(software refactoring)，篇幅13页半，引用了111篇文献。全文分为8个部分。阅读全文

posted @ 2011-12-14 21:15 玉泉老博阅读(645) 评论(0) 推荐(0) 编辑

2011年12月5日

推荐一个不错的网站 REFCARDZ（IT开发技术相关）

摘要：偶尔搜到“23种经典设计模式UML类图汇总”，顺着链接过去就找到了REFCARDZ。这个网站提供IT开发技术方面各类"cheat sheet"（比如对于设计模式，23种Gof的模式被编成很精简的格式），适合以前学过的人不时地翻阅复习或快速查找技术要点（但可能不适合作为新手的入门材料），其中有些cheat sheet还是大师级人物写的。阅读全文

posted @ 2011-12-05 15:02 玉泉老博阅读(483) 评论(0) 推荐(0) 编辑

2011年11月30日

[论文笔记] reCAPTCHA: Human-Based Character Recognition via Web Security Measures (Science, 2008)

摘要： CAPTCHA（“Completely Automated Public Turing test to tell Computers and Human Apart”）这个称谓最早是在2000年由CMU的Luis von Ahn, Manuel Blum等人提出，中文直译为“全自动区分计算机和人类的图灵测试”，俗称“验证码”，现在是登陆注册时的必备步骤。最初的CAPTCHA的图片由机器生成，控制程序知道正确答案，其发挥的功效纯粹就是为了防止机器自动注册；而reCAPTCHA则赋予了这个过程更加深远的意义，除了能更好区分人和机器的作用，还能“顺便”为文献数字化做出贡献阅读全文

posted @ 2011-11-30 21:11 玉泉老博阅读(840) 评论(0) 推荐(0) 编辑