MSRA-USTC 计算机科学领域前沿进展第三讲
MSRA-USTC 计算机科学领域前沿进展第三讲
------自然语言处理初窥
MSRA-USTC实验区课程---计算机领域前沿进展第三讲,这次课上我们有幸请到了微软亚洲研究院自然语言处理组蒋龙和刘晓华研究员,为我们带来了在信息膨胀的新时代自然语言处理领域的新进展.
随着互联网技术的不断发展,网络社区,博客等新鲜事物不断涌现.无论是纵谈国家大事,或是分享生活琐屑,已不再需要传统的纸墨笔砚,一切尽在弹指之间. 如今研究员们苦的已不再是数据资料的匮乏,而是如何在海量的数据中择取于我有用的信息,信息的膨胀对于我们来说既是机遇同时也是一种挑战,自然语言处理是计算机科学领域与人工智能领域中的一个重要方向,志于实现人与计算机的有效通信,面对着海量的数据,微软亚洲研究院的资深研究员们是怎样对其加以利用的呢?
在课堂上,两位研究员先后为我们介绍了自然语言处理领域的先进成果:
Engkoo: 该项技术已经成功运用在必应词典,不仅提供词义解释,例句赏析,标准发音,例句视频,还支持模糊查询等等功能,从多方面加以解释,加深用户对词义的理解。下面是链接,有兴趣的可以体验体验:http://dict.bing.com.cn/#%3Ahome
Chinese couplets: 对联是中国传统文化的精华,即使如今也有着庞大的粉丝团体。现如今电脑也能对对联:除了下联定字,机巧对联外,微软对联还为一些爱好者提供了:用字推敲,
嵌名对联等功能,不仅如此,对于一幅绝对,你怎么对其加以收藏呢,微软提供了图表装裱功能,允许爱好者将对联装裱,生成图片保存。电脑对联: http://couplet.msra.cn/
QuickView: 足不出户而知天下事,这个已经不再是神话,但是如何能几乎实时的了解到世界上发生的新鲜事物呢,Twitter 就能满足网友的这个需求,其功能还在进一步的完善中。
无论是Engkoo还是couplet 开发 ,两位研究员一直给我们阐释着一个思想:make best use of users’ power. 网民的力量是强大的,他们能帮助我们很好的完善研究成果,比如必应词典中的很多例句和翻译都是直接来自网友们的各类文本信息,电脑对联中的精品绝对好多都是出摘自于各对联社区,简单的thumb down or up也能对我们的研究成果作出合理的评价,并且往往是最为公正的。
这次课上,我们不仅接触了解了自然语言处理的一些先进成果,更重要的是领会了网络时代做研究的一种必备工具:users’ power。充分利用网民提供的数据信息,让我们的技术与时俱进!