Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

最近,来自中国杭州的初创公司深度求索(DeepSeek)发布了两款大语言模型,在全球科技界引起广泛关注。这两款模型性能可与美国科技巨头开发的主流工具相媲美,但研发成本和所需算力却大大降低。

Nature连发三篇文章聚焦DeepSeek

2025年1月20日,DeepSeek发布了部分开源的“推理”模型DeepSeek-R1,该模型能够解决一些科学问题,水平接近OpenAI于2024年底发布的GPT-o1。几天后的1月28日,DeepSeek又推出了Janus-Pro-7B,这是一款根据文本提示生成图像的模型,其性能与OpenAI的DALL-E 3以及Stability AI的Stable Diffusion相当。

Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

国际顶尖学术期刊Nature在其官网连续发布了三篇关于DeepSeek的文章。1月29日的文章提到,科学家们纷纷涌入DeepSeek,从AI专家到数学家再到认知神经学家,他们对DeepSeek-R1的高性能和低成本感到惊叹。次日的文章则强调,DeepSeek-R1执行推理任务的水平与OpenAI的GPT o1相当,并且向研究人员开源,相比之下,OpenAI推出的GPT o1及最新成果o3基本上都是黑匣子。

Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

DeepSeek-R1的成本也令人印象深刻。尽管DeepSeek尚未公布训练DeepSeek-R1的全部成本,但据估计,其算力租赁费用约为600万美元,而Meta公司训练Llama 3.1 405B的算力是其11倍,训练成本超过6000万美元。此外,使用DeepSeek-R1界面的用户只需支付运行ChatGPT o1费用的不到三十分之一。DeepSeek还创建了DeepSeek-R1的迷你“蒸馏”版本,以便算力有限的研究人员也能使用该模型。

Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

另一篇文章分析了中国如何创造出震惊世界的AI模型DeepSeek,指出政策支持、大量资金以及众多AI专业人才帮助中国企业建立了先进的大语言模型。国内研究人员表示,这家初创企业的成功在意料之中,符合政府成为全球人工智能领导者的雄心。中国科学院计算技术研究所副所长陈云霁研究员指出,鉴于中国在开发大语言模型上的巨额投资和大量博士人才,像DeepSeek这样的公司在中国出现是不可避免的。

事实上,阿里巴巴也在1月29日发布了迄今为止最先进的大语言模型Qwen2.5-Max,称其性能优于GPT-4o、DeepSeek-V3以及Llama-3.1-405B。上周,月之暗面联合字节跳动发布了新的推理模型Kimi 1.5和Kimi 1.5 1.5-pro,在某些基准测试中的表现优于GPT-o1。

责任编辑:张蕾

主题测试文章,只做测试使用。发布者:广众网,转转请注明出处:https://www.zmdnky.org.cn/article/7850.html

(0)
广众网的头像广众网
上一篇 2025年2月1日 下午1:44
下一篇 2025年2月1日 下午2:44

相关推荐

  • OneRepublic将登上2025央视春晚

    OneRepublic将登上2025央视春晚,会在武汉分会场带来 ‘Counting Stars‘。 责任编辑:乔娇 TT0002

    2025年1月27日
    10400
  • 开年车市:车企价格战又将全面打响 新年首日再掀波澜

    2025年开工第一天,车企之间的价格战再次升温。特斯拉Model 3推出了一系列优惠政策,包括5年0息贷款和保险补贴,降低了购车门槛。小鹏汽车也推出了“5年0首付0利息”的购车政策,覆盖多款车型,最高贴息达到57000元。广汽丰田通过限时“一口价”活动,将锋兰达起售价降至8.98万元,威兰达起售价降至12.98万元,并提供核心部件终身质保服务。智己汽车则宣布…

    2025年2月5日
    2500
  • 大S遗产分配需看2小孩设籍何处 继承金额受户籍影响

    大S遗产分配需看2小孩设籍何处。台湾知名女星徐熙媛(大S)在过年期间前往日本旅游,因流感并发肺炎不幸去世,享年48岁。她的离世引发了台湾民众的恐慌,许多人纷纷前往医院接种流感疫苗。 大S名下有投资和活期存款,其两处豪宅市价估计超过6.5亿新台币。关于她的遗产分配问题,需要确认她与现任丈夫具俊晔是否正式登记结婚,以及两个孩子的户籍所在地。如果孩子是大陆籍,根据…

    2025年2月6日
    2400
  • 韩国客机起火原因或来自充电宝 初步怀疑手提行李引发

    1月28日,韩国釜山金海国际机场一架釜山航空客机发生火灾。这架航班号为BX391的飞机原计划飞往中国香港。火灾发生后,机上所有176名乘客和机组人员通过充气滑梯紧急疏散。疏散过程中,有7人因吸入烟雾受轻伤,已被送往附近医院接受治疗。 涉事飞机为空客A321型号,在准备起飞时发生了火灾。火势从飞机尾部开始,并迅速蔓延至整个机体。根据消防部门和机舱内乘客提供的信…

    2025年1月31日
    2500
  • 柯洁被判负专家解读韩国提子新规 新规引发争议

    江苏棋院副院长兼省围棋队总教练丁波对柯洁在第29届LG杯世界围棋棋王战三番棋决赛中的表现进行了点评。1月22日,27岁的中国棋手柯洁九段与韩国名将卞相壹九段进行第二盘对决。比赛中,柯洁因两次提子未放在指定区域导致比赛两次中断,最终遗憾落败,双方比分变为1-1平。 比赛开始时,柯洁由于提子没有放在自己的棋盖内,根据韩国围棋新规被罚两目。中韩双方交涉后,比赛继续…

    2025年1月23日
    5200

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信