openfst常用命令
记录一些遇到的常用的openfst的命令。help的信息我就不放了,可以自己看。
fstaddselfloops:
加一个自旋,一般是在初始节点上。别的节点没试过。。这句在生成L.fst的时候有遇到过。
将自回路添加到 FST 的状态以通过它传播消歧符号
它们被添加到每个最终状态,每个状态都带有非 epsilon 输出符号
至少在一个弧状态之外。 与预先确定一起使用
用法:fstaddselfloops in-disambig-list out-disambig-list [in.fst [out.fst]]
例如:fstaddselfloops in.list out.list <in.fst> withloops.fst
fstaddselfloops "echo 122 |" "echo 7 |" | \
#加上自旋,主要是对122 7 的#0进行自旋。注释此句,比较下区别就知道了。
49 #区别: 0 -> 0 [label = "#0:#0", fontsize = 14]; < 0 0 122 7
fstisstochastic:
对G.fst进行检查,为什么做这一步?
检查 FST 是否随机,如果有则退出成功。
打印出最大错误(以日志为单位)。
用法:fstisstochastic [in.fst]
fstisstochastic $outlangdir/G.fst
fsttablecompose:
用法:fsttablecompose(fst1-rxfilename | fst1-rspecifier)(fst2-rxfilename | fst2-rspecifier)[(out-rxfilename | out-rspecifier)]
选项:
--compose-filter:使用的合成过滤器,其中之一:“alt_sequence”,“auto”,“match”,“sequence”(string,default =“sequence”)
--connect:如果为 true,则在输出前修剪 FST。 (布尔,默认 = true)
- 匹配侧:进行表匹配的组合的一侧,其中一个:“左” 或 “右”。 (字符串,默认 =“左”)
注意顺序 fsttablecompose A.fst B.fst > C.fst
可以这样简易理解:A a:b/0.4 B b:c/0.3 C a:c/0.7
fstcompile:
从简单文本格式创建二进制 FST。最常用的一个了。
用法:fstcompile [text.fst [binary.fst]]
标志:
--accept:type = bool,default = false
以接受者格式输入
--allow_negative_labels:type = bool,default = false
允许使用负面标签(不推荐; 可能会导致冲突)
--arc_type:type = string,default =“standard”
输出弧类型
--fst_type:type = string,default =“vector”
输出 FST 类型
--isymbols:type = string,default =“”
输入标签符号表
--keep_isymbols:type = bool,default = false
用 FST 存储输入标签符号表
--keep_osymbols:type = bool,default = false
将输出标签符号表与 FST 一起存储
--keep_state_numbering:type = bool,default = false
不要重新编号输入状态
--osymbols:type = string,default =“”
输出标签符号表
--ssymbols:type = string,default =“”
状态标签符号表
库标志:
标志来自:flags.cc
--help:type = bool,default = false
显示使用信息
--helpshort:type = bool,default = false
显示简要的使用信息
--tmpdir:type = string,default =“/ tmp /”
临时目录
--v:type = int32,default = 0
详细级别
标志来自:fst.cc
--fst_align:type = bool,default = false
在适当的地方写入 FST 数据
--fst_default_cache_gc:type = bool,default = true
启用缓存的垃圾回收
--fst_default_cache_gc_limit:type = int64,default = 1048576
缓存触发垃圾回收的字节大小
--fst_read_mode:type = string,default =“read”
可映射文件的默认文件读取模式
--fst_verify_properties:type = bool,default = false
验证由 TestProperties 查询的 fst 属性
--fst_weight_parentheses:type = string,default =“”
包围印刷复合砝码的第一重量(例如配对重量,元组重量和派生类)的字符以确保嵌套复合砝码的正确 I / O; 必须具有大小 0(无)或 2(开括号和右括号)
--fst_weight_separator:type = string,default =“,”
印刷复合重物之间的字符分隔符必须是单个字符
--save_relabel_ipairs:type = string,default =“”
将输入重新标记对保存到文件
--save_relabel_opairs:type = string,default =“”
将输出重新标记对保存到文件
标志来自:symbol-table.cc
--fst_compat_symbols:type = bool,default = true
适当时需要符号表匹配
--fst_field_separator:type = string,default =“”
用作打印字段之间分隔符的字符集
fstarcsort:
排序 FST 的弧线。排序。
用法:fstarcsort [in.fst [out.fst]]
计划标志:
--sort_type:type = string,default =“ilabel”
比较方法之一:“ilabel”,“olabel”
库标识:
标志来自:flags.cc
--help:type = bool,default = false
显示使用信息
--helpshort:type = bool,default = false
显示简要的使用信息
--tmpdir:type = string,default =“/ tmp /”
临时目录
--v:type = int32,default = 0
详细级别
标志来自:fst.cc
--fst_align:type = bool,default = false
在适当的地方写入 FST 数据
--fst_default_cache_gc:type = bool,default = true
启用缓存的垃圾回收
--fst_default_cache_gc_limit:type = int64,default = 1048576
缓存触发垃圾回收的字节大小
--fst_read_mode:type = string,default =“read”
可映射文件的默认文件读取模式
--fst_verify_properties:type = bool,default = false
验证由 TestProperties 查询的 fst 属性
--fst_weight_parentheses:type = string,default =“”
包围印刷复合砝码的第一重量(例如配对重量,元组重量和派生类)的字符以确保嵌套复合砝码的正确 I / O; 必须具有大小 0(无)或 2(开括号和右括号)
--fst_weight_separator:type = string,default =“,”
印刷复合重物之间的字符分隔符必须是单个字符
--save_relabel_ipairs:type = string,default =“”
将输入重新标记对保存到文件
--save_relabel_opairs:type = string,default =“”
将输出重新标记对保存到文件
标志来自:symbol-table.cc
--fst_compat_symbols:type = bool,default = true
适当时需要符号表匹配
--fst_field_separator:type = string,default =“”
用作打印字段之间分隔符的字符集