DeepSeek新模型火到海外 开源大模型正超越闭源

DeepSeek上周发布了开源模型DeepSeek-R1,并声称其性能可以与OpenAI的o1正式版相媲美,这一消息在海外AI业界引发了广泛讨论。焦点在于,当开源模型的能力达到甚至超越最新的闭源模型时,可能会改变整个大模型的竞争格局。

DeepSeek新模型火到海外 开源大模型正超越闭源

根据DeepSeek的介绍,DeepSeek-R1在Codeforces、GPQA Diamond、MATH-500、MMLU、SWE-bench Verified等测试中的得分接近或超过o1正式版。该模型在后训练阶段大规模应用了强化学习技术,在仅有少量标注数据的情况下显著提升了推理能力。

Meta首席AI科学家Yann Lecun认为,DeepSeek-R1的发布意味着开源大模型正在超越闭源模型,而不是单纯地表明中国公司在AI领域超越美国公司。他表示,DeepSeek将从开放研究和开源中受益,类似于Meta的PyTorch和Llama。通过提出新想法并在他人工作的基础上进行实现,由于这些工作是公开和开源的,每个人都能从中获益,这就是开放研究和开源的力量。

责任编辑:张佳鑫 0764

主题测试文章,只做测试使用。发布者:广众网,转转请注明出处:https://www.zmdnky.org.cn/article/7279.html

(0)
广众网的头像广众网
上一篇 2025年1月27日 下午6:45
下一篇 2025年1月27日 下午6:45

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信