每张显卡上roll不同的样本还是同一个样本呀,我的代码每张显卡上市roll同一个样本导致效率很低,加载数据集的时候能在分布式训练上数据并行嘛~
每张显卡上roll不同的样本还是同一个样本呀,我的代码每张显卡上市roll同一个样本导致效率很低,加载数据集的时候能在分布式训练上数据并行嘛~