DeepSeek,“朋友圈”爆了

AI圈的当红辣子鸡,已经引发了厂传厂“交友”的现象级表现。 

国内,云厂商跑得最快。 

2月1日,华为云就打响第一枪,随后腾讯云、阿里云、百度智能云、京东云、联通云等主流云平台也相继宣布接入DeepSeek系列模型。 

同期,DeepSeek的这股“接入热”还蔓延到了各大芯片厂商、应用端企业,呈现出“提速”态势。 

短短一周内,不仅海光信息、摩尔线程等芯片厂商宣布适配上线,上市公司奇安信、视觉中国、易点天下、盛天网络、神州数码、万兴科技等更是密集宣布:接入DeepSeek。 

而这股“交友”热潮在国内还算是“虽迟但到”。 

要知道,早在1月底,微软、英伟达、亚马逊、英特尔、AMD等海外巨头们就相继拥抱,纷纷跟DeepSeek牵起了手。 

何以至此,还得从今年春节DeepSeek的一炮而红谈起。 

半个月前,国产开源大模型DeepSeek-R1正式发布,在数学、代码、自然语言推理等任务上性能对齐OpenAI-o1正式版,可谓一鸣惊人。 

更关键的是,DeepSeek-R1用的还是更经济的计算资源,推理成本仅为OpenAI-o1的几十分之一,其开源的路径,更是降低了各领域AI应用的研发成本,可以有效加速大模型应用创新和普及。 

这也就意味着以低成本已可训练出足够好的AI模型,这将是一场通往AGI时代的技术普惠。 

众所周知,AI界苦降本增效久矣,打出“高性能、低成本”牌的DeepSeek,自然成为了香饽饽。 

01 他们,都在跟大模型黑马“交朋友”

截至目前,DeepSeek“朋友圈”的企业可一分为三来看。 

首先,是春江水暖鸭先知的云厂商们,每天都有新人在官宣进场。 

国内云服务厂商无问芯穹来的最早,在1月28日除夕一大早宣布了其Infini-AI异构云对DeepSeek-R1-Distill 32B模型的支持。 

随后四大云巨头中,当属华为云最快。 

2月1日就在官微宣布,与硅基流动联合首发并上线基于昇腾云服务的DeepSeek R1/V3推理服务,表示“其性能可与全球高端GPU部署模型相媲美”。 

腾讯云阿里云,则分别以“开发者仅需3分钟即可接入调用”“用户可零代码实现从训练到部署再到推理的全过程”主打“一键部署”的高效。 

百度智能云靠“卷”出圈,早早打出低价牌,推出“超低价格方案及限时免费服务”。 

京东云跟联通云则划出“按需部署”的关键词,前者“支援公有云线上部署及专混私有化实例部署两种模式”,后者“兼顾私有化和公有化场景,提供全方位运行服务保障”。 

从云厂商的角度来看,他们率先与DeepSeek实现深度对接,无论是为了构建AI生态,丰富平台的AI服务、还是降低成本,亦或是吸引开发者、满足客户的多样化需求,快速接入最火的大模型,都是笔划算的买卖。 

再到芯片厂商,更是全球闻风而动,为DeepSeek提供算力支持。 

这里面,不在春节假期的海外公司占了先机。 

1月31日,英伟达宣布,NVIDIA NIM已经可以使用DeepSeek-R1。同日,微软称已将DeepSeek-R1正式纳入Azure AI Foundry。亚马逊云科技(AWS)也宣布:企业和开发者可以在Amazon Bedrock和Amazon SageMaker AI中部署DeepSeek-R1模型。 

2月2日,沐曦联合GiteeAl发布全套Deepseek-R1千问蒸馏模型,DeepSeek-V3满血版在国产沐曦GPU首发体验上线。 

随后在2月4日,摩尔线程、天数智芯、海光信息同天入局,其中,海光信息技术团队已完成DeepSeek V3和R1模型与海光DCU的适配并上线,摩尔线程也宣布,已实现对DeepSeek蒸馏模型推理服务的部署。 

此外,DeepSeek系列模型首发即支持昇腾平台,神州数码旗下神州鲲泰推理服务器产品搭载昇腾硬件,可全面支持DeepSeek系列模型的快速部署。 

而这场AI盛宴,应用端自然也不会缺席。 

在网络安全应用上,奇安信自研QAX安全大模型通过DeepSeek-R1进行了一系列的优化和蒸馏,运营成本实现了大幅降低,同时在威胁研判等多个场景下的模型性能方面获得了显著提升。 

其中安全专业问答整体性能分数提升约16%,极大提升了智能威胁分析和决策的准确度。 

数字创意软件公司万兴科技2月4日也宣布,旗下视频创意、绘图创意及文档创意软件业务多款产品完成了与DeepSeek-R1的深度适配,包括万兴喵影、亿图图示、亿图脑图MindMaster、万兴PDF等。 

此外,在应用侧接入DeepSeek的相关企业还有推动视觉内容服务领域AI技术应用进一步升级的视觉中国、智能营销服务商易点天下、智能视频解决方案与视频云服务商当虹科技以及互联网和移动安全产品及服务提供商三六零。 

从云到芯片再到应用,DeepSeek卷起的全球AI风暴,已然深度卷进产业中的每一位玩家。 

DeepSeek,“朋友圈”爆了

来源:猎云网 

02 “AI界拼多多”,要走出一条生态路

值得注意的是,DeepSeek的爆火,并不是偶然。 

这还得从它的基因说起。 

据天眼查显示,DeepSeek公司全称为“杭州深度求索人工智能基础技术研究有限公司”,简称“深度求索”,成立于2023年7月,公司股东为宁波程恩企业管理咨询合伙企业(有限合伙)(即知名量化资管巨头幻方量化)和创始人梁文锋。 

从股东便可看出,彼时下场大模型的深度求索,有的是量化基金的背景,在一众AI大牛创业中,有点宛如异类。 

但是优势也非常明显:资金、团队、硬件,它齐了。 

幻方量化于2015年成立,通过AI技术优化量化投资策略,2021年公司管理规模就突破千亿元,成为国内量化私募四巨头之一。 

也由此,梁文锋跟团队积累了量化投资和高性能计算领域的深厚背景和丰富经验,同时伴随的还有AI能力。 

根据《财经十一人》内容,2023年国内拥有超过1万枚GPU的企业就包括了幻方量化。早在2019年,幻方就成立了AI团队,自研深度学习平台。 

这些,都足以让深度求索在大模型圈低调前行。 

当时,在《暗涌》的文章中,幻方目标很明确,“深度求索”强调专注做真正人类级别的人工智能,目标是研究——开源——推动行业发展,最终通向AGI。 

在文章中,梁文锋更是坚定认为“OpenAI不是神,不可能一直冲在前面”。 

这些都奠定了DeepSeek的基调,不是模仿,而是原创,不是学徒,而是挑战者。 

成立半年后,第一代大模型DeepSeek Coder便发布,同月还率先开源中国首个MoE大模型(DeepSeek-MoE)。 

2024年5月,其第二代开源Mixture-of-Experts(MoE)模型——DeepSeek-V2面世,因为DeepSeek V2模型因在中文综合能力评测中的出色表现,且以极低的推理成本引发行业关注。 

也是这一次,DeepSeek有了“AI界的拼多多”之称。 

去年底,全新系列模型DeepSeek-V3首个版本上线并同步开源,根据公开信息,DeepSeek V3的表现几乎追上了Anthropic Claude 3.5 Sonnet和OpenAI GPT-4o。 

连Meta AI研究科学家田渊栋都给出了赞赏,称“这是一项了不起的工作”。 

再到成本上,官方技术论文更是披露,DeepSeek-V3模型的总训练成本为557.6万美元,而GPT-4o等模型的训练成本约为1亿美元。 

强烈的成本对比之下,直接让DeepSeek谱写了AI界的新神话。 

彼时,深度求索对外表示,“这是一个全新的开始。”也由此,DeepSeek在AI圈开始有了些许声音。 

今年1月20日,DeepSeek-R1模型正式发布,并同步开源模型权重。与此同时,DeepSeek应用(不包含网站数据)上线5天日活就已超过ChatGPT上线同期日活,成为全球增速最快的AI应用。 

随后,乘着超预期的产品体验带来的口碑裂变,DeepSeek迎风而上,在1月28日发布开源多模态模型Janus-Pro。 

其中,70亿参数版本的Janus-Pro-7B模型在使用文本提示的图像生成排行榜中优于OpenAI的 DALL-E 3和Stability AI的Stable Diffusion。 

截至2月2日,DeepSeek登顶140个国家的苹果App Store下载排行榜首位。到2月4日,上线20天,DeepSeek日活突破2000万,创下新纪录。 

C端的火爆,自然也为B端的国内外生态圈快速搭建埋下伏笔。 

手持低价和开源并行的策略,无疑成为DeepSeek朋友圈引爆的催化剂。 

而建立更大更完善的生态,正是DeepSeek发展的未来所在。 

近日,梁文锋对《暗涌》说,在这波AI浪潮中,DeepSeek的出发点是走到技术前沿,去推动整个生态发展。他们只负责基础模型和前沿的创新,其它公司在DeepSeek的基础上构建toB、toC的业务。 

正如英伟达的领先不只是一个公司的努力,也是整个西方技术社区和产业共同努力的结果。 

他说,“中国AI的发展,同样需要这样的生态。” 

文章来源于网络。发布者:广众网,转转请注明出处:https://www.zmdnky.org.cn/article/8847.html

(0)
广众网的头像广众网
上一篇 2025年2月7日 下午6:45
下一篇 2025年2月7日 下午7:44

相关推荐

  • 青岛目标:数字经济核心产业增加值占比超12%推动高质量发展

    在数字化浪潮席卷全球的今天,数字经济已成为衡量一个城市竞争力的重要指标。青岛作为我国北方重要的经济中心和开放门户,正以实际行动抢抓数字经济发展机遇。根据青岛市人民政府办公厅最新发布的《数字青岛2025年行动方案》,青岛计划通过一系列创新举措,力争到2025年实现数字经济核心产业增加值占地区生产总值比重达到12%以上,并建成3个千亿级数字经济产业集群。 这一目…

    2025年5月16日
    7100
  • 娃哈哈商标转让,宗馥莉又有大动作

    娃哈哈集团准备转让“娃哈哈”商标? 2月11日,《中国企业家》查询国家知识产权局商标局官网发现,杭州娃哈哈集团有限公司正在对“娃哈哈”商标进行转让,目前“申请收文”环节已结束,日期为2025年1月21日,但商标受让主体未显示。记者发现,娃哈哈集团其拥有的饮料、童装、医疗器械等多类目“娃哈哈”商标均办理了商标转让。 对于商标转让一事,娃哈哈相关工作人员对《中国…

    2025年2月12日
    9200
  • 港股物流股走高顺丰控股涨近4% 快递业预期受益促内销与出海双向驱动

    4月14日讯(编辑 冯轶)今日港股继续反弹向上探高,其中快递物流板块涨幅居前引发市场关注。 截至发稿,顺丰控股(06936)涨近4%、中通快递-W(02057.HK)、极兔速递-W(01519)双双涨超3%,中国外运(00598)、京东物流(02618.HK)等个股也纷纷跟涨。 消息面上,商务部近期加大力度推进内外贸一体化,帮助外贸产品拓内销,指导行业协会、…

    2025年4月14日
    7000
  • 上海,诞生一笔脑机接口最大融资丨投融周报

    大家好,我是长风。今天给大家带来这一周资本市场的专业投研信息。 本周焦点回顾: 新消费赛道,连锁餐饮成焦点。近期,社区快餐连锁阿赛小面完成首轮融资,投资方为美业连锁巨头流行美股份,亚洲吃面公司跟投;此外,西安卓味餐饮管理有限公司旗下品牌韩卓味宣布成功完成A轮融资,此次融资资金达4500万元人民币。本轮融资由慧财投资领投。 大健康赛道,高端生物医学设备受关注。…

    2025年2月16日
    10100
  • 特斯拉内部报告流出:明星项目Cybercab竟遭高管集体反对

    4月17日讯(编辑 马兰)特斯拉在过去一年中坚定宣传和推进其机器人出租车项目Cybercab,不少投行也将其视为增加其未来估值的推手之一。然而,据媒体采访多位公司人士后发现,该项目立项似乎是马斯克的一言堂式决定,其实内部反对意见较多。 据悉,2024年2月底,特斯拉曾就新型经济型电动汽车Model 2进行最后辩论,这款汽车也是特斯拉此前传出消息将主推的250…

    2025年4月17日
    8400

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信