首页
智算服务
AI 生态大厅
算力商情政策资讯合作与生态场景方案关于我们

大模型参数越多越好?训练数据量越大越好?参数和训练数据量之间怎么平衡?_大模型的维度和参数量有什么关系-CSDN博客

发布日期:2026-04-06 来源:新浪网作者:新浪网
模型 参数量 (N) 训练数据 (D) 实际比例 (D/N) 状态
Chinchilla 70B 1.4 Trillion 20 : 1 严格达标
Llama 2 70B 2.0 Trillion ~28 : 1 轻微过度
Llama 3 70B 15.0 Trillion ~214 : 1 极度过度
DeepSeek-V3 671B 14.8 Trillion ~22 : 1 接近标准(因MoE架构特殊)
本文转载自新浪网, 作者:新浪网, 原文标题:《 大模型参数越多越好?训练数据量越大越好?参数和训练数据量之间怎么平衡?_大模型的维度和参数量有什么关系-CSDN博客 》, 原文链接: http://k.sina.com.cn/article_7879848900_1d5acf3c401902w7uk.html。 本平台仅做分享和推荐,不涉及任何商业用途。文章版权归原作者所有。如涉及作品内容、版权和其它问题,请与我们联系,我们将在第一时间删除内容!
本文相关推荐
暂无相关推荐