摘要:
stop: List of string。【生成文本时,碰到此token就会停下,但结果不会包含此token】 stop_token_ids: List of string。【生成id时,碰到此id就会停止,会包含此id,比如 tokenizer.eos_token_id [im_end]】 最终判 阅读全文
摘要:
class K2SpeechRecognitionDataset(torch.utils.data.Dataset): The PyTorch Dataset for the speech recognition task using k2 library. This dataset expects 阅读全文
摘要:
Openfst 弧的2个标注分别表示:消耗的输入、发出的输出,希腊字母<epsion>表示沿弧的空输入或空输出 FSM(Finite State Machines,有限状态机) 有限个状态 同一时刻只能处于同一个状态 不同状态可以互相转换 ==> 状态是无序的 FSA(Finite State ac 阅读全文