DeepSeek真正成为了一条鲶鱼

DeepSeek把两大“AI巨头”都卷到了

自走红之初,DeepSeek就因成本优势不断震惊业界,这为其开源生态发展奠定了非常好的基础。

过去大模型走闭源路线与成本息息相关。许多大模型在预训练阶段几乎都选择了不计成本地投入,而DeepSeek选择剑走偏锋,把重点放在了上岗之后的强化学习。用反复高强度地训练,倒逼自身不断地调整姿势,理解逻辑,自我反思,直到结果令人满意。

以一直在难产的OpenAI GPT-5为例,估算显示,该项目一次为期半年的训练,仅计算成本就高达约 5亿美元。目前,该项目已开发超过18个月,成本花费巨大,却仍未取得预期成果。

这给国内很多大模型公司都敲响了警钟,意味着想训练顶级的模型,单是GPU的采购成本就高达几十亿,部署十万卡集群的 “烧钱”程度更是难以想象。

相比之下,DeepSeek找到了一条低算力,高效率的路径,其训练成本只是OpenAI相关模型的十几甚至几十分之一。 

DeepSeek还狠狠回击了所谓“开源是硅谷精神”的论调,其不仅开源了所有的模型和论文,供所有人去免费下载,还公开了训练方法,允许大家去做数据的蒸馏,去训练自家的模型。

这意味着全球所有相关的技术人员,都能在现有的能力基础之上,去做研发与开发,至此,新的技术,新的应用就会在这个新生态里产生。

DeepSeek在2025年1月20日发布R1模型后,仅7天新增用户1亿(含网页端与应用端),成为史上最快破亿的AI应用。至2月1日,其日活跃用户(DAU)突破3000万大关,超越豆包(1695万),直逼ChatGPT的5323万。

从云服务商、电信运营商,到多数手机、汽车厂商,越来越多企业正在奋力拥抱 DeepSeek。

这条鲶鱼很快也搅动了全球AI市场,两大“AI巨头”先后决定一改闭源态度,松口向公众免费。

先是1月31日,OpenAI上线了新的推理模型o3-mini,并进一步下放了免费的权限。OpenAI CEO Sam Altman首次承认在开源上的失误,指出后续可能找到不同的开源策略,有望重拾模型开源。

最新消息则来自于百度,其在2月13宣布,从4月1日起,文心一言将全面免费。同时即日起,文心一言上线深度搜索功能;该功能也将于4月1日起免费开放使用。

要知道,去年李彦宏还是坚定的闭源拥趸。“今天不管是在中国也好、美国也好,最强的基础模型都是闭源的。闭源是有真正商业模式的,是能够赚到钱的,能赚到钱才能聚集算力、聚集人才”。

仅仅不到一年过去,情况就开始逆转。

开源的底气到底是什么?

其实许多人仍对DeepSeek如何算得又快又好抱有好奇,其中比较重要的一点,就是它实现了芯片最底层的优化。DeepSeek在其发布的技术论文中表示,DeepSeek采用了PTX(Parallel Thread Execution)编程,通过定制PTX优化,使DeepSeek的系统和模型可以更好释放底层硬件的性能。

相比于外界盛传的算力限制让其寻找性价比方案,DeepSeek其实是主动拥抱的优化,用PTX把某些SM(GPU里负责计算的核)做了编程,让他们来负责做数据的传输,使得多个GPU之间的数据传输的速度变快,解决了大模型计算中的一大瓶颈;同时,它还用PTX优化了其他的包括计算梯度在内的运算,使得同样的GPU发挥出了10倍的效能,这在训练与推理过程中扮演着十分重要的角色。

除了芯片优化,DeepSeek在训练方法上也下了真功夫。不同于传统的大模型训练方法,它选择直接跳过监督微调阶段,专注于通过规则驱动的强化学习训练推理模型。

从DeepSeek V3 Base的预训练模型开始,完全省略了监督微调阶段,为了实现大规模的强化学习,研究团队使用了一种名为GRPO(群体相对策略优化)的方法。有人用现实生活生动类比了这一数学原理的精妙之处,“通俗的说,就是一群学生在解决一个问题。老师不再单独给每个学生打分,而是让学生自己比较答案。答案更好的学生会受到鼓励,而其他人则会从错误中吸取教训。随着时间的推移,整个团队会共同进步,变得更加准确和一致”。

观察DeepSeek这一本土化大模型的发展路径,芯片优化与GRPO,可谓是两大法宝,提供源源不断的光照与养分,但光有养分还不够,一个好的土壤更加重要。DeepSeek的全资母公司幻方量化,原本对AI押宝许久,同时也是国内少数破千亿的量化私募,既不缺钱也没有融资需求。跟国内绝大多数AI相比,DeepSeek在商业化上可以说完全佛系,内部甚至没有设立过多的营销、产品岗位。

同时,据公开信息显示,DeepSeek研发团队有 139人,均是立足于本土的年轻团队,他们更知道这片土地到底需要什么,所以以上这些快速迭代,前沿的实验成果才有了茁壮成长的土壤。

工程上精益求精,技术上大刀阔斧进行创新,DeepSeek的爆火绝非偶然。事实上,六年前这场布局就已开始。它的母公司幻方量化早在2019年就花费2亿打造萤火一号超算集群, 2022年默默地屯了万张A100显卡,是ChatGPT 3.5发布之后第一波手握万卡入场券的少数模型公司,积累下的丰富资源增强了开疆拓土的信心。

至此,他们在V3实现了震撼的性价比,R1在实现性价比的同时还跑通了影响很大的新范式,一跃成为AI领域的新星,甚至有些观点认为,DeepSeek可以称为中国AI大模型的ChatGPT时刻。对于行业而言,DeepSeek的案例再次证明:在AI竞赛中,垂直突破、开放协作、长期主义仍是赢得竞争的关键。

全球资本重估中国科技企业

DeepSeek掀起的人工智能革命浪潮还改变了中国科技企业的估值叙事。

截至2025年2月12日,恒生科技指数ETF近1周累计上涨7.67%。2月13日,恒生指数再度高开0.46%,恒生科技指数涨0.77%。哔哩哔哩-W、网易-S、百度集团-SW、中芯国际等涨超2%。

据中国证券报报道,高盛日前发布报告称,中国人工智能(AI)企业深度求索(DeepSeek)的出现正激发投资者加速购买中国股票的热情。同时,高盛维持对明晟(MSCI)中国指数的超配评级,预计该指数今年将上涨14%。

此前,中国科技企业一直普遍处于被低估的状态中。大摩的一篇报告指出,全球投资者对中国科技企业的估值体系仍停留在传统互联网思维,未能充分反映其在前沿科技领域的突破。以腾讯、阿里为例,二者港股市盈率分别只有19和15,远远低于美股科技股的市盈率。

现在,DeepSeek真正成为了一条鲶鱼。

美国针对DeepSeek的报道里,有一个高频词汇经常出现:“Sputnik Moment”,又名斯普特尼克时刻(该术语源于1957年10月4日苏联成功发射的 “斯普特尼克 1号”人造卫星。这是人类历史上第一颗人造地球卫星,它的发射成功使苏联在太空领域取得了领先地位,让美国意识到自己在科技,尤其是太空技术方面的落后,给美国带来了巨大的危机感和紧迫感)。

这件事对当时的美国冲击很大,随后1958年NASA成立,美国举全国之力完成了登月,重新回到太空领域里面领先的地位,才拔掉了自己心头的这根刺。而这次,在美国最核心的AI领域里,DeepSeek又扎进去了一根新的刺。

主题测试文章,只做测试使用。发布者:广众网,转转请注明出处:https://www.zmdnky.org.cn/article/9716.html

(0)
广众网的头像广众网
上一篇 2025年2月14日 上午11:26
下一篇 2025年2月14日 上午11:26

相关推荐

  • 印度地球观测卫星发射失败:任务异常与太空探索挑战

    5月18日,印度空间研究组织(ISRO)的一次重要发射任务以失败告终。当天,极地卫星运载火箭(PSLV)搭载地球观测卫星“EOS-09”从斯里哈里科塔发射场升空,目标是将这颗卫星送入太阳同步轨道。然而,发射后不久,地面控制中心与卫星失去联系,最终确认“EOS-09”未能进入预定轨道。此次任务的失败不仅对印度航天计划造成了打击,也引发了外界对印度航天技术可靠性…

    2025年5月18日
    10800
  • 联瑞新材拟7.2亿增资扩产,加码布局高端市场

    联瑞新材作为国内先进无机非金属材料领域的佼佼者,其近期发布的拟发行可转债公告引发了市场广泛关注。这一动作不仅揭示了公司在高端材料领域加速布局的战略意图,也折射出行业对高性能粉体材料需求的持续攀升。 从公告内容来看,联瑞新材计划通过募集资金总额不超过7.2亿元,重点投向高性能高速基板用超纯球形粉体材料和高导热高纯球形粉体材料两大项目。其中,高性能高速基板用超纯…

    2025年5月17日
    5200
  • 鸿翔环境正式开启北交所IPO辅导进程

    近年来,随着我国环保政策的不断深化和“双碳”目标的持续推进,建筑垃圾资源化利用逐渐成为行业关注的焦点。近日,鸿翔环境科技股份有限公司(以下简称“鸿翔环境”)正式启动北交所IPO辅导的消息引发市场热议。作为一家专注于建筑垃圾分类处置及资源化利用的企业,鸿翔环境的上市计划不仅标志着其自身发展迈入新阶段,也为行业发展注入了新的活力。 根据公开信息,鸿翔环境的主要业…

    2025年5月19日
    3900
  • 我国首个脑机接口临床与转化病房正式成立

    近日,北京天坛医院脑机接口临床与转化病房正式成立,标志着我国在脑机接口技术的临床应用领域迈出了重要一步。作为国内首个将脑机接口技术应用于临床治疗的病房,这一创新平台不仅汇聚了顶尖科研力量,还为神经系统疾病患者提供了全新的治疗可能性。 脑机接口技术是一种通过直接连接大脑和外部设备实现信息传递的技术,近年来在国际上备受关注。然而,这项技术从实验室走向临床应用仍面…

    2025年5月17日
    5800
  • 大厂年终奖折叠,差距在拉大

    B站2024年度弹幕为“接”。“接”,代表着年轻人对美好事物的期待与渴望, 例如考试上岸、入职升职、表白成功、欧气爆棚时,用户便会发出“接”字弹幕,以示“沾沾好运”。 临近年终,互联网上网友们的普遍情绪是,“接”高额年终奖。 在“降本增效”口号大喊三年之后的今天,互联网公司年终奖备受关注。有无年终奖、年终奖多少、年终奖何时发放,这些对于自称“牛马”的打工人来…

    2025年1月23日
    10400

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信