Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

最近,来自中国杭州的初创公司深度求索(DeepSeek)发布了两款大语言模型,在全球科技界引起广泛关注。这两款模型性能可与美国科技巨头开发的主流工具相媲美,但研发成本和所需算力却大大降低。

Nature连发三篇文章聚焦DeepSeek

2025年1月20日,DeepSeek发布了部分开源的“推理”模型DeepSeek-R1,该模型能够解决一些科学问题,水平接近OpenAI于2024年底发布的GPT-o1。几天后的1月28日,DeepSeek又推出了Janus-Pro-7B,这是一款根据文本提示生成图像的模型,其性能与OpenAI的DALL-E 3以及Stability AI的Stable Diffusion相当。

Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

国际顶尖学术期刊Nature在其官网连续发布了三篇关于DeepSeek的文章。1月29日的文章提到,科学家们纷纷涌入DeepSeek,从AI专家到数学家再到认知神经学家,他们对DeepSeek-R1的高性能和低成本感到惊叹。次日的文章则强调,DeepSeek-R1执行推理任务的水平与OpenAI的GPT o1相当,并且向研究人员开源,相比之下,OpenAI推出的GPT o1及最新成果o3基本上都是黑匣子。

Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

DeepSeek-R1的成本也令人印象深刻。尽管DeepSeek尚未公布训练DeepSeek-R1的全部成本,但据估计,其算力租赁费用约为600万美元,而Meta公司训练Llama 3.1 405B的算力是其11倍,训练成本超过6000万美元。此外,使用DeepSeek-R1界面的用户只需支付运行ChatGPT o1费用的不到三十分之一。DeepSeek还创建了DeepSeek-R1的迷你“蒸馏”版本,以便算力有限的研究人员也能使用该模型。

Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

另一篇文章分析了中国如何创造出震惊世界的AI模型DeepSeek,指出政策支持、大量资金以及众多AI专业人才帮助中国企业建立了先进的大语言模型。国内研究人员表示,这家初创企业的成功在意料之中,符合政府成为全球人工智能领导者的雄心。中国科学院计算技术研究所副所长陈云霁研究员指出,鉴于中国在开发大语言模型上的巨额投资和大量博士人才,像DeepSeek这样的公司在中国出现是不可避免的。

事实上,阿里巴巴也在1月29日发布了迄今为止最先进的大语言模型Qwen2.5-Max,称其性能优于GPT-4o、DeepSeek-V3以及Llama-3.1-405B。上周,月之暗面联合字节跳动发布了新的推理模型Kimi 1.5和Kimi 1.5 1.5-pro,在某些基准测试中的表现优于GPT-o1。

责任编辑:张蕾

主题测试文章,只做测试使用。发布者:广众网,转转请注明出处:https://www.zmdnky.org.cn/article/7850.html

(0)
广众网的头像广众网
上一篇 2025年2月1日 下午1:44
下一篇 2025年2月1日 下午2:44

相关推荐

  • 辽宁又将迎降雪 冷空气持续发力

    今天是大年初八,也是蛇年的第一个工作日。假期结束得很快,许多人可能和我一样感到起床困难。这周还需要上四天班,周六也要上班,请大家记得调整闹钟。 春节期间,冷空气频繁活动,最低气温已连续多日低于-20℃。开工第一周,冷空气势力依然强劲,气温将持续偏低,这种寒冷可能会持续到2月上旬。预计从明天开始直到2月8日,我国大部分地区将自北向南经历两轮降温过程。除了冷空气…

    2025年2月5日
    5600
  • 重庆江津通报黑臭水排入长江 应急处置与长效整改并行

    2月18日上午,重庆市江津区发布了关于“网友反映珞璜安家溪存在水体污染问题”的通报。2月16日19时许,有网民在短视频平台反映珞璜安家溪存在水体污染问题。江津区委、区政府高度重视,区生态环境局和珞璜工业园于当晚21时赴现场开展应急处置。2月17日上午,区政府副区长杨玉书组织相关单位赴现场调查处置。当天下午,区委书记唐大军、区长赵光平召开专题会,进一步研究部署…

    2025年2月18日
    7200
  • 中国人过年指南 春节习俗全解析

    春节是中国最具仪式感的传统节日之一,从除夕夜到正月初七,各地都有丰富多彩的习俗。除夕,也称“年三十儿”,意味着旧岁的结束和新年的开始。这一晚,家家户户灯火通明,家人团聚吃年夜饭,守岁至深夜,寓意驱邪迎祥。 守岁时,人们会进行祭祀神祖、给压岁钱、包饺子、放鞭炮等活动。拜年的习俗始于明朝,无论是否相识,朝官之间都会互拜,百姓则会拜访亲友,并赠送红包以表达祝福。初…

    2025年1月28日
    12500
  • 广州解禁土狗 移出危险犬名录

    广州解禁土狗。1月21日,《广州市公安局、广州市农业农村局关于广州市一般管理区实行圈养和严格管理区禁止饲养、销售、繁殖的危险犬标准及品种的通告》正式施行,有效期为5年。该通告对危险犬进行了定义,包括格斗犬只等攻击性强的烈性犬只、有烈性犬血统的混种犬只以及体型特别巨大的大型犬只。具体品种认定条款中列出了35种烈性犬的具体品种,并规定体高超过71cm(含71cm…

    2025年1月22日
    5200
  • DeepSeek再发布新模型 Janus-Pro显著提升多模态能力

    1月28日凌晨,人工智能社区Hugging Face上发布了开源多模态AI模型Janus-Pro。作为Janus的高级版本,Janus-Pro采用了优化的训练策略,扩展了训练数据,并且拥有更大的模型规模。这些改进让Janus-Pro在多模态理解和文本到图像的指令跟踪能力方面有了显著提升,同时也增强了文本到图像生成的稳定性。该系列包括7B和1.5B参数量的两个…

    2025年1月29日
    13200

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信