【转载】Goldendict下优质词典简介及安装 (2016-07-29 23:33:20)
原文地址:http://blog.sina.com.cn/s/blog_933b54980102x6hr.html 作者:李晓瑞0405
使用Arch Linux一年以来,如果要问自己最为中意的词典程序是? 当然是Goldendict啦!想详细了解这款瑞士军刀的请猛戳这里.
以前在Win下都是用的lingoes, 感觉还不错,词典库很全,中英双解的词典很多,其它诸如取词, 整句翻译的功能都还能凑合着用(其实是用的第三方引擎),总之这个对于天朝大众还是很不错的啦!一年前转到Arch Linux下就一直在找Linux下比较好用的词典程序和词典,综合来看,Goldendict确实是上上之选(可以认为是stardict的升级版么?),支持的词典格式比较典型的有
dsl bgl stardict...
,总之是够用了啦!不过话说回来,选择过多有时候却等于没有选择,星际译王的词典确实很多,但试用了一些,大多质量不是很高,幸好使用Google找到了这么一个
, RT,楼主实在是很用心,几乎把每个细节都讲到了,对于刚使用goldendict筒子们无疑是帮了一个大大的忙,不过帖子中提供的词典链接基本都已经坏掉了,而且个人觉得对于词典使用者来说,那些步骤也确实太麻烦了,下边我就一些优质的词典安装使用做简要的说明,跟着我这个来下载完后基本就能用了,Troubleshoot部分就一些细节再做一丁点补充。「前人种树,后人乘凉」呼呼~~
goldendict安装
只要你使用的发行版不是过于小众,应该都可以在软件源找到goldendict这款软件。
- Debian/Ubuntu
sudo apt-get install goldendict
- Arch
sudo pacman -S goldendict
Oops…如果实在是没有,解决方案有两个,一是果断换发行版!!二是前往github自行编译。 自从爪机换成Android后自己用的主力词典软件也是goldendict, 将下边带词库文件复制到指定目录下即可使用,非常棒。
词典下载及使用方法简介
- Oxford Advanced Learner’s Dictionary 8th edition(En-En)-牛津高阶词典(英英)第8版,含图片及英式发音和美式发音
- Merriam-Webster’s Collegiate 11th edition(En-En)-韦氏大学词典(英英)第11版,含图片及发音
- Longman DOCE5-Longman Dictinary of Contemporary English 5th edition(En-En)-朗文当代第五版英英词典,含发音和图片,大部分例句也带有朗读,很强悍!!!
- Longman Pronunciation Dictionary 3rd edition(En-En)-朗文发声辞典第三版,词典中有英音、美音,并对于“多音”的词,配有preference poll图表,即不同的发音在不同地区、不同年龄层里所占的比例。不得不说,这个碉堡了!!!
- Longman DOCE5 Extras(En-En)-不包含单词发音和图片,但是包含了该词汇的各种搭配,和牛津搭配词典类似
- 牛津高阶英汉双解 第四版(En-zh_CN)-英汉双解,我想这个对于国人是必不可少的吧?bgl的格式,排版很美观,无发音
en_US_1.0.zip
- -词形匹配,查词时会自动将复数或者其他形式转换为标准形式
以上6部词典应该是完全够用了,前3部英英词典任选一部即可。以上的文件放在我的百度云网盘中,需要的请移步这里,将词典下载至你想要放的任何位置(直接使用网页打包下载可能会不稳定而下载失败,极其不推荐这种方式下载,做好心理准备…),再到goldendict下设置词典目录即可,重新扫描->大功告成!
之前用Dropbox分享过,最近Dropbox老是提示我流量过多而禁用分享,所以转向了不限流量的百度云,同时也方便国内用户下载。最近发现有其他人保存了我发布过的Dropbox分享,下载时选择「复制到我的Dropbox」就不会给分享人造成流量过多而禁用分享的问题了,而且通过同步下载的方式也稳定的多。词典下载链接
- 百度云, 『保存到网盘』,尽量不要使用网页下载 ,下载不稳定并且容易损坏原文件。
- Dropbox(流量太大长期被Dropbox关闭分享请使用以下分流链接), then click the Add to my Dropbox, 中文的话点击『复制到我的Dropbox』,尽量不要使用网页下载,一来下载不稳定并且容易损坏原文件,二来会增加Dropbox的流量而被暂时禁掉掉分享链接!!我用了几年前注册过的Dropbox帐号对以上词典进行分流,下载方式同上,建议通过『复制到Dropbox』方式下载。如果你还没有Dropbox帐号的话不妨猛击
- En-En_Longman_DOCE5 and Longman DOCE5 Extras(En-En)
- En-En_Longman_Pronunciation3
- En-En_Merriam_Webster11
- En-En_OALD8
- En-zh_CN_OALD4
- en_US_1.0.zip
词形匹配
很多人抱怨 Goldendict 取词 “books” 居然查不到,它不会自己转换成 “book”,那不过是你没有正确设置而已,事实上这一点 Goldendict 利用构词法规则库可以做得极其强大。编辑-》词典-》词典来源-》构词法规则库可以设置其所在目录。英语构词法规则库到这里下载,注意需要解压缩,英文版软件则通过
Edit->Dictionaries->Morphology
设置构词法规则库所在文件夹。各词典使用截图
文件目录树
.dictionary
├── [4.0K] En-En_Longman_DOCE5
│ ├── [2.2K] En-En-Longman_DOCE5.ann
│ ├── [1.4K] En-En-Longman_DOCE5.bmp
│ ├── [ 17M] En-En-Longman_DOCE5.dsl.dz
│ ├── [1.3G] En-En-Longman_DOCE5.dsl.files.zip
│ ├── [ 854] En-En-Longman_DOCE5_Extras.ann
│ ├── [1.4K] En-En-Longman_DOCE5_Extras.bmp
│ └── [ 53M] En-En-Longman_DOCE5_Extras.dsl.dz
├── [4.0K] En-En_Longman-Pronunciation
│ ├── [ 277] En-En-Longman_Pronunciation_abrv.dsl.dz
│ ├── [ 848] En-En-Longman_Pronunciation.ann
│ ├── [1.4K] En-En-Longman_Pronunciation.bmp
│ ├── [3.3M] En-En-Longman_Pronunciation.dsl.dz
│ └── [566M] En-En-Longman_Pronunciation.dsl.dz.files.zip
├── [4.0K] En-En_MW11
│ ├── [ 850] En-En-MWCollegiate11.ann
│ ├── [ 980] En-En-MWCollegiate11.bmp
│ ├── [ 13M] En-En-MWCollegiate11.dsl.dz
│ └── [570M] En-En-MWCollegiate11.dsl.dz.files.zip
├── [4.0K] En-En_OALD8
│ ├── [ 290] En-En_Oxford Advanced Learners Dictionary_abrv.dsl.dz
│ ├── [3.8K] En-En_Oxford Advanced Learners Dictionary.ann
│ ├── [ 978] En-En_Oxford Advanced Learners Dictionary.bmp
│ ├── [ 23M] En-En_Oxford Advanced Learners Dictionary.dsl.dz
│ └── [562M] En-En_Oxford Advanced Learners Dictionary.dsl.dz.files.zip
└── [4.0K] En-zh_CN_OALD4
│ └── [ 11M] Oxford_Advanced_Learner_English-Chinese_Dictionary-4th.bgl5 directories, 22 files
Troubleshoot-故障排除
网上大多给出的是dsl及音频图片的原始格式,我这里已经对dsl进行了压缩处理(使用dictzip进行压缩,Arch Linux下安装dictd即可使用dictzip命令),音频和图片的zip文档是从115上下下来的,如果对音频图片不在乎的话就不用下…dsl.dz.files.zip这些庞然大物了。我最开始下的都是dsl和音频图片的源格式,可折腾死我了, 几十万个音频用zip压缩起来估计得要个一个星期左右, 压缩刚开始的时候速度还可以,到后头就变成了蜗牛,实在是受不了,放在/tmp下也没见得好很多,其它诸如提升进程优先级的方法也试过,除了使CPU的风扇呼呼地吹之外也没见有什么加速的效果,最后果断放弃之,皇天不负有心人,在Google 搜索框内
En-En site:115.com
总算发现了我要的这些文档。不过下下来后比较了一下,发现网络上的那些zip文档中包含的音频文件总比我下的原始文件数少了那么几个,10多万个少那么一两个问题也不大啦!凑合着用吧!
zip …提示「参数列表过多」或者是压缩速度过慢
若你不小心下载到了.rar的音频和图片文件,结果解压缩后却发现文件夹下有100,000 个音频文件等着你… 如果你真有耐心,那就按下边的步骤来做吧。
压缩过程不要在图形界面下做!!!100000 个文件会把你的CPU和内存拖垮的!!!
- 压缩速度过慢.
将压缩得到的文件置于/tmp文件夹下,Arch Linux下此文件夹利用ram和swap作为介质,对硬盘的损伤会小很多,速度也会快很多。
将图片音频解压到/tmp下某一文件夹下(这一步可以在图形界面下做),解压后得到的文件像下边的这个样子:
.
├── 12ste01v.wav
├── 9keesh01.wav
├── 9keros01.wav
├── 9ketog01.wav
├── 9khalk01.wav
├── 9khalk02.wav
- 参数列表过多.
进入音频或图片所在文件夹.
find . -name "*" -print | zip -9 /tmp/En-En-your dictionary.dsl.dz.files.zip -@
另外一种方法就是for d in ./\*. ; do zip -9 En-En-your-dictionary.dsl.files.zip "$d" ; done
不知为何,我用第二种方法的时候压缩速度实在是太慢,用第一种方法则很快,网友们可自行测试一下。
- 找不到dictzip这个命令.
看网上说Ubuntu下安装这个软件包即可,Arch Linux下则安装dictd这个包,其它发行版搜索下应该也能找到
- 使用goldendict是总是显示加载中.
有可能是你下的词典不行,我当时下的一个牛津高阶英汉双解bgl格式的可把我坑死了,最后终于找到了上文中那个相对比较完美的版本(除了音标不完整)。
- goldendict使用维基百科不显示图片-not display pictures while using Wikipedia
自行到github编译goldendict最新版-go to https://github.com/goldendict/goldendict. The readme file will tell you how to compile from the source. Arch Linux下只需使用AUR中的git版本即可,大爱Arch!^_^
笔记
关于GoldenDict的更多了解以及使用方法和细节,见官方或用户的指导或使用意见
https://github.com/Dictionaryphile/GoldenDict_zh_manual
https://github.com/goldendict/goldendict/wiki/Supported-Dictionary-Formats