训练集大小 num_samples和总样本数的关系是啥,有点没明白
小白想来问下,这里optimizer是在哪里配置的呢?另外bart原文中微调应该是freeze了部分参数,这里的freeze逻辑对应的是哪里?
大佬,请问下,这个config.json文件中的各个参数的含义的解释在哪能找的到?针对不同的模型,参数不一样。