2012 年 8月 26 日随笔档案 - 沙场醉客

2012年8月26日

摘要：一。工作目标 1.构建汉英对齐语料库。2.下载并编译GIZA++，CMU-Cambridge Statistical Language Modeling toolkit，（以下简称CMU toolkit）获得实验所需的可执行文件。3.利用目标1所构建的语料库，通过GIZA++进行IBM Model 1-5的训练。4.利用目标1所构建的语料库，通过mkcls构建word classes。5.利用目标1所构建的语料库的英文语料，通过CMU toolkit生成英语的语言模型。二。实验环境 Ubuntu 8.04 LTS Servergcc version 4.2.4三。工作步骤以下按工作目标分节。阅读全文

posted @ 2012-08-26 23:46 沙场醉客阅读(2173) 评论(0) 推荐(0) 编辑

成功源于积累----波爸

公告