智算多多联系我们


关注我们

公众号

视频号
隐私协议用户协议
◎ 2025 北京智算多多科技有限公司版权所有京ICP备 2025150592号-1
| 模型 | 参数量 (N) | 训练数据 (D) | 实际比例 (D/N) | 状态 |
|---|---|---|---|---|
| Chinchilla | 70B | 1.4 Trillion | 20 : 1 | 严格达标 |
| Llama 2 | 70B | 2.0 Trillion | ~28 : 1 | 轻微过度 |
| Llama 3 | 70B | 15.0 Trillion | ~214 : 1 | 极度过度 |
| DeepSeek-V3 | 671B | 14.8 Trillion | ~22 : 1 | 接近标准(因MoE架构特殊) |