以制表符分隔的TXT文件转换成Supermemo可直接导入的文本格式的过程图解

一直有人问如何将自己的TXT格式的学习材料导入到Supermemo 2006中,经过一晚的试验,最后终于弄通了。
(1) 我的原始文件是一个成语词库,每行前一部分是问题,后一部分是答案,中间有一个制表符分隔
chengyu_fmt.JPG

(2) 从网上下载EmEditor文本编辑器软件,我用的是8.04版本,并安装好
 
(3) 用EmEditor打开原始文本文件,点菜单“Search->Replace...”执行替换功能
在弹出的窗口中勾上“Use Regular Expressions”选项,即使用正则表达式(几年以前写JAVA程序时用过正则表达式,没想到现在用上了)
Find栏内填   (^.*)\t(.*$)
Replace with栏内填  Q: \1\nA: \2\n
注意上面A:的后面有个空格,千万不要丢掉。点“Replace All”,全部替换后的结果如下图:

replace.JPG

(4) 设置编辑器
点菜单“Tools->Properties for current configure”,出现如下对话框:
在File选项卡中,点“Saving...”,在“Save Details”对话框中,选中“Save Unicode as HTML/XML Character Reference”。之所以选这款EmEditor编辑器就是因为这个功能,从Google上先查“HTML Escape Character”,后来明白把字符用“&#nnnnn;”表示的方法专业上术语叫做“Numeric Character Reference”,经过一番搜索才找到这款编辑器软件,其它编辑器是否支持这个功能就不太清楚了。
emeditor_setting.JPG

(5) 从File菜单中选择"save as", 在Encoding那个下拉框中选择如下图的那个中欧字符集。就是这个小窗口,害我试了大概1个小时才明白了其背后的道理,也就是说,我们的带汉字的文件放到iso-8859-2这种编码方案中找不到对应的编码时,就会用前面提到的Numeric Character Reference方法来代替。
encoding.JPG
取好文件名后,点OK,会弹出一个提示窗口,选择最后那个选项,OK
save_prompt.JPG

(6) 完成,可以用写字板打开保存后的文件,可以看到汉字都显示成“犹”之类的格式了,就可以完美地导入到Supermemo了
finish_conv.JPG

最后生成的成语文本文件可以从 这里 下载。

2010年7月:

无意中看到舍得在2009年12月的一篇文章中使用文字转码工具BabelPad来转换词库,感兴趣者可以试试。

posted @ 2009-03-31 23:23  申龙斌的程序人生  阅读(8801)  评论(12编辑  收藏  举报