目前使用同样的脚本和gsm8k数据集训出来的模型和作者的差别很大,可能环境有一定影响,想问问实现的时候的具体版本
目前使用同样的脚本和gsm8k数据集训出来的模型和作者的差别很大,可能环境有一定影响,想问问实现的时候的具体版本