DeepSeek正式宣布更新R1 0528版本：性能接近O3和Gemini

2025-05-31 10:45 1093评论

根据5月29日的Kuai Technology，DeepSeek正式宣布R1型号已完成了小型升级版本，并且当前版本为DeepSeek-R1-0528。据报道，DeepSeek-R1-0528仍然使用DeepSeek V3基本模型作为2024年发布的基础模型，但它已在培训后过程中投入了更多的计算能力，这大大改善了模型思维和推理的深度。在许多基准评估（例如数学，编程和一般逻辑）中，更新的R1模型在所有国内模型中都取得了一流的结果，并且已经与其他总体绩效（例如O3和Gemini-13-Pro）的其他领先国际模型变得接近。与旧版本的R1相比，在复杂识别任务中新版本的新版本的性能是纳帕布蒂重要的。例如，在AIME 2025测试中，新版本的模型的准确性从旧版本的70％增加到87.5％，这是开发e在推理过程中改善了模型思维的深度。在AIME 2025测试集中，旧模型每个问题平均使用12K令牌，而新模型的每个问题平均使用23K令牌，这表明它在解决问题的过程中已经对问题进行了更详细和更深入的思考。同时，Deviceek关闭了DeepSeek-R1-0528思想链，并训练了Qwen3-8b基础，并获得了Deviceek-R1-0528-QWEN3-8B。可以理解，该8B模型仅次于DeepSeek-R1-0528在数学试验AIME 2024中，它超过了Qwen3-8b（+10.0％），并且与qwen3-235b进行了比较。 DeepSeek认为，DeepSeek-R1-0528思想链将是对学术推理模型的Hugeresearch研究以及行业中小型模型的发展。其他功能更新幻觉-Guni：DeepSeek R1的新版本是针对“幻觉”问题的优化。与旧版本相比，更新的型号减少了幻觉在诸如重新写作和抛光之类的方案中，对率的率约为45％至50％，总结和理解阅读，这可以有效地提供更准确，更可靠的结果。创意写作：基于R1的旧版本，更新的R1模型是为了限制争论性论文，小说，散文和其他样式，可以将长度较长的长度和更完整的结构和内容的长度功能传递出来，并显示出更接近人类偏好的写作风格。 [本文的结尾]如果需要打印，请确保指示来源：Kuai技术编辑：Shiqi

请尊重我们的辛苦付出，未经允许，请不要转载PG电子麻将胡了_PG电子娱乐的文章！

PG电子麻将胡了_PG电子娱乐

相关文章