【人工智能】谷歌研究团队发现DiLoCo具有更优Scaling Laws | 分布式低通信优化 | 稳定扩展超参数 | 损失下降更快 | 带宽减少99% | 最优批大小 | 数据并行 | 未来趋势 | 最佳拍档 | Podwise