关于bing的一些问题及想法

一、发现bing的bug

1、语序错误。

eg:Anyone can sign up to take courses free through Coursera.org.

bing翻译:任何人都可以报名参加课程免费通过Coursera.org

原意:任何人都可以通过Coursera.org报名参加免费课程。

翻译语序的问题造成了原意的曲解。

推测原因:这个应该是由于bing是按照一个个单词翻译然后组成一句,没有考虑到语序的问题。

 

2、一词多义。

eg: it offers 16 degrees and 38 certificate courses online — but none for free. 

bing翻译:它提供了 16 摄氏度和 38 证书课程在线 — — 但没有一人免费。

原意:它在线提供了16个学位和38种证书课程----但没有一人免费。

推测原因:一个词语有多种意思,系统选择了其中一个不符合此句的意思。

 

3、翻译时没有完善句子、进行句意增补。

eg:Courses feature multiple-choice tests with instant feedback, and in some classes, students grade each other's papers.

bing翻译:课程专题即时的反馈,多项选择题测试及部分班级、 学生级对方的论文。

原意:课程特点包括多种选择的及时测试,和一些与学生班级年级各自相对应的论文。

推测原因:bing只是根据单词翻译成中文。而丢失的一些成分bing没有补回来。

 

4、语法错误

eg:in much the same way.

bing翻译:多相同的方式。

原意:在很大程度上。

推测原因:原文翻译出来是对前句补充说明、但是正确的翻译却是作为后一句话的状语限定作用。

 

 

5、综合错误。(即很多种错误在一个句子中同时出现)

 

二、设计新的创新功能

1、分析

(1)目前bing只是将全篇文章翻译成中文。在中文页面,将鼠标移动到某一句上会出现此句的英文。

(2)用翻译工具的人群分为:1、只是略懂英语。

                                            2、看得懂常用语句。

                                            3、英语高手。但有些专业词汇不清楚。

(3)针对用户,我们可以将功能细化。

2、解决

(1)针对英语老手:我们只需要在英文界面设置单词取词翻译。当鼠标移动到某一单词时出现某单词的释义、常用例句、音标、读音等。

(2)针对懂日常语句的人群:需要复杂句子的翻译。复杂句子经常出现前文提到的综合错误。针对略懂英语的问题,即需要解决以上所有问题,另外加上常用语句。长用语句在一词多义、语序错误和常用习语上比较容易犯错。这些都可以归类到综合错误中去。

综合错误解决:a、crowd sourcing.(下文谈众包实行方案)b、如下用NABC方法提出的系统匹配方案。c、工作人员纠错。

用NABC分析多义词解决方案

 

还是拿16degrees来说 系统把他翻译为了16摄氏度 其实文义为16个学位这是就是翻译系统对多义词的优先级考虑不周而引起的,
那么对于NABC解决方案来讲:

N:用户发现系统对多义词不能正确翻译,不符合文章意思,需要设计一个翻译方法能够最大程度的降低多义词的不正确翻译。
A:做法是将当前多义词匹配出现次数最多的其他关联词,每次翻译时在固定长度的上下问去寻找匹配关联词,如能找到就使用能够匹配到关联词的这个词义。就能降低这种翻译错误。
B:好处是不需要用户完成,只需要系统录入各个多义词的匹配词汇就行了。用户体验好。

C:这个功能在谷歌翻译和百度翻译还没有实现,这个创新点还没有在市面上存在,开发成本也不高。开发出来对产品的竞争能力有提升。

 

 三、谈crowd sourcing的实现

建立一个用户建议页面,(流程尽量简洁,简化流程有利于吸引更多的人来提建议)用户在此平台上提出建议后给工作人员审核,审核通过给予一定奖励。这些所获奖励所有人都可以看到,便于激励其他用户来提建议。工作人员内部可以对用户设定一个百分比(工作人员采用用户所提建议的百分比)和活跃用户程度的数值,系统可以将百分比和活跃用户程度数值双高的用户的建议放在前面审核。提高有用信息的摄取。活跃用户程度数值也可以考虑公开。

四、结语

 

一个完整的机器翻译要做到分词、分析、匹配、翻译、调整。bing翻译对于其中的分析、调整还有许多需要改进的地方。期待bing能做的更好~

 

posted on 2012-08-12 22:05  思思cici  阅读(239)  评论(0编辑  收藏  举报

导航