智算多多
官方邮箱:service@zsdodo.com

公司地址:北京市丰台区南四环西路188号总部基地三区国联股份数字经济总部


京公网安备11010602202532号 目前,DeepSeek尚未针对DeepSeek-R1-0528发布详细的模型卡来介绍其更多功能。然而,这一新版本已在开发者群体中引发了热烈反响,众多开发者在体验后纷纷表示,DeepSeek-R1-0528在编程、逻辑推理以及交互能力等方面均展现出了显著的提升。

已有开发者对DeepSeek-R1-0528进行了基准测试,并称这是开源领域的一次重大突破。代码测试平台Live CodeBench的数据显示,其性能已接近OpenAI在4月中旬发布的o4 mini和o3模型的高版本。
同时,文本召回测试的结果也表明,在32k以内的文本处理上,DeepSeek-R1-0528相较于之前的R1版本有了显著提升,但在60k时性能则有所下降。这意味着,在32k以内的文本范围内,使用新R1模型根据给定材料进行提问并获取回答时,其准确度会更高。
多位开发者通过实际案例体验后表示,DeepSeek-R1-0528的效果已基本与Claude 4持平,甚至在某些情况下表现更佳。
从实际效果来看,我注意到平面的橙色漫反射以及控制面板的美观程度。这两者都是使用同一个提示词一次性生成的,Claude 4 sonnet生成了542行代码,而DeepSeek-R1-0528则生成了728行。此外,帧率和运动角度的细节也值得关注。
还有开发者让DeepSeek-R1-0528、Claude 4和DeepSeek-V3-0324在飞机大战游戏中生成对比效果。结果显示,新版R1在之前的基础上新增了许多道具,画面质量也有了显著提升。
本次升级不仅体现在性能指标上,更在核心架构上实现了创新突破。
模型支持高达128K token的超长上下文窗口,使其能够流畅处理整本技术手册、复杂项目代码库等长文档任务。测试显示,在32K token内的召回准确度大幅优于前代。
推理能力实现结构化升级。用户明显感受到新版R1的思维链(Chain-of-Thought)更加清晰、逻辑更加严密。在解决"农夫过河"等经典逻辑难题时,模型能够逐步拆解问题,展示出接近人类专家的推理路径。
它是唯一能够持续正确回答'9.9减9.11是多少'的模型,这种看似简单但容易混淆的问题最能考验模型的严谨性。
DeepSeek团队延续了其一贯的"加量不加价"策略,在实现性能跃升的同时,保持了模型的开源属性和免费API策略。
尽管R1-0528表现出色,行业更期待的是DeepSeek的下一代R2模型。
DeepSeek-R1-0528的发布,不仅是对自身技术实力的展示,也为全球AI行业注入了新的活力。作为一款性能直逼OpenAI o3的开源模型,R1-0528以更低的成本和更高的灵活性挑战了传统闭源模型的霸主地位。业内人士认为,DeepSeek的持续创新将进一步推动开源AI生态的发展,促使更多企业与开发者拥抱开源技术。
与此同时,R1-0528的免费API策略也为中小型企业和独立开发者提供了宝贵机会,使其能够以较低成本构建高质量的AI应用。这无疑将加速AI技术的普及,助力全球AI生态的繁荣。
