摘要:
一。工作目标 1.构建汉英对齐语料库。2.下载并编译GIZA++,CMU-Cambridge Statistical Language Modeling toolkit,(以下简称CMU toolkit)获得实验所需的可执行文件。3.利用目标1所构建的语料库,通过GIZA++进行IBM Model 1-5的训练。4.利用目标1所构建的语料库,通过mkcls构建word classes。5.利用目标1所构建的语料库的英文语料,通过CMU toolkit生成英语的语言模型。二。实验环境 Ubuntu 8.04 LTS Servergcc version 4.2.4三。工作步骤 以下按工作目标分节。 阅读全文