Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

最近,来自中国杭州的初创公司深度求索(DeepSeek)发布了两款大语言模型,在全球科技界引起广泛关注。这两款模型性能可与美国科技巨头开发的主流工具相媲美,但研发成本和所需算力却大大降低。

Nature连发三篇文章聚焦DeepSeek

2025年1月20日,DeepSeek发布了部分开源的“推理”模型DeepSeek-R1,该模型能够解决一些科学问题,水平接近OpenAI于2024年底发布的GPT-o1。几天后的1月28日,DeepSeek又推出了Janus-Pro-7B,这是一款根据文本提示生成图像的模型,其性能与OpenAI的DALL-E 3以及Stability AI的Stable Diffusion相当。

Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

国际顶尖学术期刊Nature在其官网连续发布了三篇关于DeepSeek的文章。1月29日的文章提到,科学家们纷纷涌入DeepSeek,从AI专家到数学家再到认知神经学家,他们对DeepSeek-R1的高性能和低成本感到惊叹。次日的文章则强调,DeepSeek-R1执行推理任务的水平与OpenAI的GPT o1相当,并且向研究人员开源,相比之下,OpenAI推出的GPT o1及最新成果o3基本上都是黑匣子。

Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

DeepSeek-R1的成本也令人印象深刻。尽管DeepSeek尚未公布训练DeepSeek-R1的全部成本,但据估计,其算力租赁费用约为600万美元,而Meta公司训练Llama 3.1 405B的算力是其11倍,训练成本超过6000万美元。此外,使用DeepSeek-R1界面的用户只需支付运行ChatGPT o1费用的不到三十分之一。DeepSeek还创建了DeepSeek-R1的迷你“蒸馏”版本,以便算力有限的研究人员也能使用该模型。

Nature连发三篇文章聚焦DeepSeek 低成本高性能引关注

另一篇文章分析了中国如何创造出震惊世界的AI模型DeepSeek,指出政策支持、大量资金以及众多AI专业人才帮助中国企业建立了先进的大语言模型。国内研究人员表示,这家初创企业的成功在意料之中,符合政府成为全球人工智能领导者的雄心。中国科学院计算技术研究所副所长陈云霁研究员指出,鉴于中国在开发大语言模型上的巨额投资和大量博士人才,像DeepSeek这样的公司在中国出现是不可避免的。

事实上,阿里巴巴也在1月29日发布了迄今为止最先进的大语言模型Qwen2.5-Max,称其性能优于GPT-4o、DeepSeek-V3以及Llama-3.1-405B。上周,月之暗面联合字节跳动发布了新的推理模型Kimi 1.5和Kimi 1.5 1.5-pro,在某些基准测试中的表现优于GPT-o1。

责任编辑:张蕾

文章来源于网络。发布者:广众网,转转请注明出处:https://www.zmdnky.org.cn/article/7850.html

(0)
广众网的头像广众网
上一篇 2025年2月1日 下午1:44
下一篇 2025年2月1日 下午2:44

相关推荐

  • 江苏避免群众受损206万人次 精准预警显成效

    面对电信网络诈骗手法不断演变的挑战,江苏公安机关积极与相关部门合作,建立各类精准预警模型,多渠道发现潜在受骗群众,有效阻断涉诈风险。2024年,江苏避免了206万人次的经济损失,全省电信网络诈骗预后被骗率降至0.01%,保持全国领先水平。 前不久,苏州市公安局吴中分局横泾派出所接到反诈中心指令,辖区居民李先生可能遭到诈骗,正在取现90万元。民警立即电话联系李…

    2025年1月31日
    11700
  • 《哪吒2》因为被偷票房停了300家影院密钥 影院回应与调查展开

    近日,“《哪吒2》被偷票房损失几千万,《哪吒2》停了300家影院密钥”等话题登上热搜。资深电影博主温特表示,如果发现有影城没有排映《哪吒2》,可能是因为偷票房而被停了密钥。 查询发现,全国各地确实有多家影院近期未排片放映《哪吒2》。内蒙古赤峰中影裕维影城工作人员解释说:“因为最近看的人太多了,机器烧坏了,《哪吒》的硬盘不知道什么时候才能修好送过来。”对于偷票…

    2025年2月12日
    10300
  • 想老得慢一点?每餐都要有蛋白质 保持年轻的秘密

    随着年龄的增长,人们往往会遇到各种健康问题,如身体消瘦、行走不稳和动作迟缓等。然而,有些人却能相对减缓衰老过程,显得相对年轻。很大一部分原因是这种关键营养素的摄取——蛋白质。 蛋白质是保持年轻的原材料,尤其在65岁以后更需注重。有些老人把少吃肉或不吃肉当作饮食清淡,结果不仅不利于健康,反而更容易生病。这里的肉不仅仅指肉类食品,还包括优质的蛋白质。 国家一级营…

    2025年1月26日
    10300
  • 专家:乌军作战面临两大难题 兵力与外援成关键

    乌克兰总统泽连斯基近日在社交媒体上表示,为了在今年与俄罗斯的谈判中取得成功,乌军士兵必须坚守前线阵地,特别是在波克罗夫斯克方向以及俄罗斯库尔斯克地区。魏东旭分析称,泽连斯基对乌军士兵提出这样的要求是出于多方面的考虑。 乌克兰军队在顿巴斯地区的防御作战主要是军事行动,目的是利用现有防线阻止俄军推进,守住战略阵地以稳定战局。然而,在库尔斯克州的作战可能不仅仅是为…

    2025年2月6日
    8500
  • 纯电小车纳米 01 之后另一款新车,东风纳米 06 预告图公布 定位纯电SUV

    纯电小车纳米 01 之后另一款新车,东风纳米 06 预告图公布 定位纯电SUV!东风汽车旗下小车序列纳米今日公布了第二款车型——纳米06的预告图。这款定位为纯电SUV的新车预计在今年上半年发布。 从预告图来看,纳米06拥有较为方正的车头和车尾轮廓,头灯与尾灯均采用L字形设计,并配备了车顶行李架。新车基于东风量子架构3号平台生产,有望搭载大疆智驾系统。此前,东…

    2025年2月14日
    9500

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信