关于benchmark实验结果的疑问


![image](https://user-images.githubusercontent.com/6971044/200222482-a790b19d-10b5-4bd8-98fb-28db8ff2c277.png)

![image](https://user-images.githubusercontent.com/6971044/200222421-e669e245-3b5c-4e5c-a3b2-a66fde47f391.png)

在相同的1n1g的机器资源下，为什么对于tensor model parallel，bs更大，samples/s 还小了？