Loading

提升训练性能小办法

  1. 如果使用fp16,把句子padding成8的倍数,测试性能会提升
pad_to_multiple_of_8 = training_args.fp16 and not data_args.pad_to_max_length
pad_to_multiple_of=8 if pad_to_multiple_of_8 else None
batch = tokenizer.pad(
            input_ids, return_tensors="pt", pad_to_multiple_of=pad_to_multiple_of)
posted @ 2022-12-06 14:44  戴墨镜的长颈鹿  阅读(75)  评论(0编辑  收藏  举报