Team spec-autosub 自动对轴软件

Introduction

  在国内,随着网络技术的越来越发达与普遍,越来越多的外国影视作品进入群众的视野之中,特别是近些年来美剧、日本动漫和大学公开课在国内的蓬勃发展,限于语言障碍, 使得对这些作品的翻译成了一个急切的需求。 因此,大量的字幕工作者由于兴趣爱好,结成团体,共同完成影视作品的翻译工作,成为一个字幕小组。

字幕组中有着明确的分工,有专门负责翻译工作的翻译人员,也有很少被人知道的是做字幕对轴工作的组员们。因为翻译出来之后仅仅是文本的内容,并没有跟视频文件进行匹配,字幕组的成员们往往需要进行非常细致的比对调整,才能使得最终观众们欣赏到拥有高质量的翻译内容,并且与原视频内容配合得天衣无缝的字幕。然而对于字幕的对轴工作会占用字幕组成员非常多的时间,而且这件事情相比翻译实在是没有什么技术含量,对于字幕组这些无偿造福人类的同学们来说花费正常的学习生活时间做轴是非常不值当的。我们小组觉得如果有这样一个自动翻译兼字幕对轴的软件会给字幕组带来很大的方便。大大提高字幕组的生产效率,同时也方便了想听公开课的同学。

 

Persona

  1、小周是一个美剧字幕组的成员, 他每天会在业余时间内对几部美剧进行翻译的工作,然而每当他翻译完字幕以后,他得把他翻译好的字幕文本文件交给小组内的另一个字幕对轴人员进行繁琐的对轴工作,这不仅是一个非常漫长和细致的过程,有时候由于时间上的冲突,翻译好了的字幕不能在第一时间内对轴,导致翻译的视频发布延期, 或者比其他的翻译字幕组要慢,这使得他有时候挺头疼的,他想要是有一个好用的软件可以很快的完成对轴的工作该有多好。

2、小林和小新动是动漫迷,他们对于喜欢的动漫往往会很痴迷,想着要在第一时间内能看到视频并且了解剧情,而最先出来的动漫资源都是一些没有字幕的资源,往往等一些正规的字幕组翻译,一些热度不是太高的视频有时候会等挺久的,但是小新懂日语,他对于没有字幕的视频也能够观看自如,而小林却要等很久,小林经常想,要是小新能够帮我翻译出字幕来给我看就好了。

 

3、小宋是个国内大学生,他渴望从国外名校学习知识,而正好许多国外名校都有视频公开课。于是小宋想利用这些资源学习知识。但一个主要问题是公开课视频都没有字幕翻译,这然像小宋一样的他们对于喜欢的动漫往往会很痴迷,想着要在第一时间内能看到视频并且了解剧情,而最先出来的动漫资源都是一些没有字幕的资源,往往等一些正规的字幕组翻译,一些热度不是太高的视频有时候会等挺久的,但是小新懂日语,他对于没有字幕的视频也能够观看自如,而小林却要等很久,小林经常想,要是小新能够帮我翻译出字幕来给我看就好了。

 

 

Basic UI Design

这是我们在M1阶段做好的UI,比较简陋,但基本功能都已实现。

 

在M2中我们将会对UI做很大改进,其中之一是在播放器的右边增加“频谱图”,方便字幕人员判断视频中语音的准去起止时间。最后我们会考虑到UI的美观,对外形做一些修改。

 

User Scenario

  1、小李正在翻译美剧,他用我们的软件打开无字幕的美剧,播放过程中,音频自动切断,兼有语音识别,所以小李只要对每一句翻译好的句子做人工检验,对于翻译和对轴有问题的地方直接调整,这样视频看完了,也完成了翻译对轴的工作。

  2、小天通过我们的播放软件打开无字幕国外公开课,此时在播放的过程中,后台程序就会自动识别语音,自动加载字幕,这样小天就可以看有字幕的视频了,学习轻松了许多。

 

 

Feature List

M1我们完成的feature有:

  1、完成基本的播放器的功能,能够加载视频播放,开始,暂停,调节音量等,使满足翻译人员对视频的基本播放需求。

2、自动的分割出视频中说话的时间区间,将声音的时间轴给切割开来。

    3、自动识别语音,兼有翻译功能。

4、能够加载字幕,将一句翻译好的文本输入到软件中,对应到生成的时间轴上,并且能够显示在屏幕上。

5、完成基本的UI设计(打开文件,编辑字幕,调整播放器等功能)。

  6、对于全部翻译完成之后,可以生成相应的字幕文件格式。

7、将无字幕的视频生成内嵌字幕的视频文件。

M2我们目标feature有:

    1、在视频播放过程中,进度条相应鼠标事件 (priority: High)

2、设置快进快退的快捷键。(Priority: Low)

3、增加字幕缓冲条以显示字幕翻译到的地方。(Priority: High)

4、能够对视频的声音生成相应的频谱并且显示在软件中的显示屏上来。(Priority: High)

5、点击频谱中的位置,视频也相应到相应的位置播放。(Priority: Medium)

6、UI的redesign,美观且用户友好。(Priority: High)

 

Task Distribution

Task

Person

Core   voice division algorithm

Junyuan   Xie

UI   design

Liangjun   Song

Display   the frequency spectrum

Yishi   Xing

Media   player function

Jun Xu

PM and   get the video data for test

Tao Wu

这是我们对这个项目的需求分析NABC:

http://www.cnblogs.com/bigbadwolf/archive/2012/09/07/2676131.html

posted @ 2012-11-02 11:30  Msra-Ustc-灰太狼  阅读(1764)  评论(2编辑  收藏  举报