Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

最近,来自中国杭州的初创公司深度求索(DeepSeek)发布了两款大语言模型,在全球科技界引起广泛关注。这两款模型性能可与美国科技巨头开发的主流工具相媲美,但研发成本和所需算力却大大降低。

Nature连发三篇文章聚焦DeepSeek

2025年1月20日,DeepSeek发布了部分开源的“推理”模型DeepSeek-R1,该模型能够解决一些科学问题,水平接近OpenAI于2024年底发布的GPT-o1。几天后的1月28日,DeepSeek又推出了Janus-Pro-7B,这是一款根据文本提示生成图像的模型,其性能与OpenAI的DALL-E 3以及Stability AI的Stable Diffusion相当。

Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

国际顶尖学术期刊Nature在其官网连续发布了三篇关于DeepSeek的文章。1月29日的文章提到,科学家们纷纷涌入DeepSeek,从AI专家到数学家再到认知神经学家,他们对DeepSeek-R1的高性能和低成本感到惊叹。次日的文章则强调,DeepSeek-R1执行推理任务的水平与OpenAI的GPT o1相当,并且向研究人员开源,相比之下,OpenAI推出的GPT o1及最新成果o3基本上都是黑匣子。

Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

DeepSeek-R1的成本也令人印象深刻。尽管DeepSeek尚未公布训练DeepSeek-R1的全部成本,但据估计,其算力租赁费用约为600万美元,而Meta公司训练Llama 3.1 405B的算力是其11倍,训练成本超过6000万美元。此外,使用DeepSeek-R1界面的用户只需支付运行ChatGPT o1费用的不到三十分之一。DeepSeek还创建了DeepSeek-R1的迷你“蒸馏”版本,以便算力有限的研究人员也能使用该模型。

Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

另一篇文章分析了中国如何创造出震惊世界的AI模型DeepSeek,指出政策支持、大量资金以及众多AI专业人才帮助中国企业建立了先进的大语言模型。国内研究人员表示,这家初创企业的成功在意料之中,符合政府成为全球人工智能领导者的雄心。中国科学院计算技术研究所副所长陈云霁研究员指出,鉴于中国在开发大语言模型上的巨额投资和大量博士人才,像DeepSeek这样的公司在中国出现是不可避免的。

事实上,阿里巴巴也在1月29日发布了迄今为止最先进的大语言模型Qwen2.5-Max,称其性能优于GPT-4o、DeepSeek-V3以及Llama-3.1-405B。上周,月之暗面联合字节跳动发布了新的推理模型Kimi 1.5和Kimi 1.5 1.5-pro,在某些基准测试中的表现优于GPT-o1。

责任编辑:张蕾

文章来源于网络。发布者:广众网,转转请注明出处:https://www.zmdnky.org.cn/article/7850.html

(0)
广众网的头像广众网
上一篇 2025年2月1日 下午1:44
下一篇 2025年2月1日 下午2:44

相关推荐

  • 还没吃就让写好评,谁在助长餐厅歪风?丨中听

    评论员 董芳芳 饭还没吃上,好评就先喂嘴里了。 4月16日,三亚市市场监督管理局发布了一则情况通报,4月15日,有人在视频平台反映其在三亚林某记海南风味餐厅就餐时,店内服务态度差,购买的团餐菜品疑似提前做好,须给五星好评才可以就餐等问题,引发网民关注。接到举报后,目前三亚市市场监督管理局已联合三亚市综合行政执法局展开调查。 在外吃饭,多多少少都能遇见餐前餐后…

    2025年4月17日
    8600
  • 车厘子为啥到我们手上就容易坏 保鲜科技揭秘

    春节时,车厘子尤其受欢迎,尤其是来自智利的车厘子。这些车厘子从智利远道而来,路上要花一个多月时间,但到达中国后仍然保持新鲜。然而,一些消费者发现,刚买回家的新鲜车厘子放几天后就开始变质,表面出现坑坑洼洼,果梗也从翠绿变成褐色甚至黑色,有时内部已经腐烂。 车厘子能够长时间保鲜,主要得益于品种特性以及种植、采摘和运输过程中的精细管理。车厘子在果实膨大期施加钙肥,…

    2025年1月26日
    20800
  • 特斯拉新ModelY前5天销量超7万辆 订单火爆!

    1月24日,特斯拉新版Model Y正式登陆部分上海门店。静安区兴业太古汇特斯拉门店透露,首批新Model Y预计于3月底至4月初开始陆续交付。 同日,特斯拉美国网站也发布了新Model Y,较中国发布晚了约半个月。美国的新Model Y起售价为59990美元(约合434646元人民币),而在中国,新Model Y后轮驱动版和长续航全轮驱动版的起售价分别为2…

    2025年1月26日
    10900
  • 中国电信涨停创历史新高 三大运营商齐上涨

    2月10日上午,三大通信运营商持续走高,中国电信涨停股价创历史新高,成交额超10亿元。中国联通涨超6%,中国移动涨超4%。 责任编辑:张小花 TT1000

    2025年2月10日
    10800
  • 韩国法院将李在明所涉案件重审日期延至大选后

    总台记者7日获悉,韩国首尔高等法院将李在明涉嫌违反《公职选举法》的重审首次开庭日期延至大选后的6月18日。 韩国最大在野党要求推迟重审李在明案 韩国最大在野党共同民主党5月5日表示,该党要求首尔高等法院将总统候选人李在明所涉案件的重审推迟至总统选举后。如果法院在总统选举前作出判决,李在明的参选资格可能受影响。 韩国大法院本月1日对李在明涉嫌违反《公职选举法》…

    2025年5月7日
    8600

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信