Deepseek被“挤”到宕机!创始人17岁考入浙大 国产AI崛起引发全球关注

几乎是一夜之间,“来自东方的神秘力量”又一次震撼了海外人士。1月27日,由国产大模型公司杭州深度求索开发的Deepseek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。

Deepseek被“挤”到宕机!创始人17岁考入浙大

1月27日,DeepSeek官网显示,DeepSeek网页/API不可用。前一天,DeepSeek曾出现短时闪崩现象。对此,DeepSeek回应称,当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求。

Deepseek被“挤”到宕机!创始人17岁考入浙大 国产AI崛起引发全球关注

Deepseek来自国产大模型公司深度求索,系量化巨头幻方量化旗下大模型公司。1月20日,该公司正式发布推理大模型DeepSeek-R1。一经推出,DeepSeek-R1便凭借其“物美价廉”的特性在海外开发者社区中引发了轰动。

Deepseek被“挤”到宕机!创始人17岁考入浙大 国产AI崛起引发全球关注

今年1月20日,国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会,听取对《政府工作报告(征求意见稿)》的意见建议。DeepSeek创始人梁文锋参加此次座谈会,他既是深度求索(DeepSeek)创始人,也是头部量化私募幻方的创始人,创业范畴横跨金融和人工智能领域。

Deepseek被“挤”到宕机!创始人17岁考入浙大 国产AI崛起引发全球关注

在校期间,梁文锋对金融市场产生了浓厚的兴趣。特别是在2008年全球金融危机之际,他带领团队探索了机器学习技术在全自动量化交易中的应用潜力,这一经历为他日后的职业生涯奠定了坚实的基础。毕业后,他将目光转向更广阔的金融市场。

Deepseek被“挤”到宕机!创始人17岁考入浙大 国产AI崛起引发全球关注

2013年,梁文锋与浙大同学徐进共同创立了杭州雅克比投资管理有限公司,两年后又成立了杭州幻方科技有限公司,致力于通过数学和人工智能进行量化投资。2015年的市场波动中,幻方依靠先进的高频量化策略取得了令人瞩目的成绩。2016年是幻方的重要转折点,这一年,公司推出了首个基于深度学习的交易模型,并实现了所有量化策略的AI化转型。2018年,幻方正式确立了以AI为核心的发展战略。然而,随着业务的快速扩展,算力瓶颈逐渐显现。

Deepseek被“挤”到宕机!创始人17岁考入浙大 国产AI崛起引发全球关注

为解决计算资源不足的问题,2019年,梁文锋带领团队自主研发了“萤火一号”训练平台,总投资近2亿元,搭载了1100块GPU。两年后,“萤火二号”的投入增加到10亿元,搭载了约1万张英伟达A100显卡。2021年,幻方的资产管理规模突破千亿大关,跻身国内量化私募领域的“四大天王”之列。2023年,他宣布将正式进军通用人工智能领域,并创办了深度求索DeepSeek,专注于做真正人类级别的人工智能。

2024年5月,DeepSeek发布混合专家语言模型DeepSeek-V2。同年12月,DeepSeek-V3问世,这款性能优越且性价比极高的大语言模型被硅谷同行誉为“来自东方的神秘力量”。DeepSeek之所以受到科技圈关注,在于DeepSeek-V3的出现极大地降低了大模型训练和应用的成本,DeepSeek-V3训练成本仅557.6万美元,而OpenAI训练ChatGPT-4所花费的成本高达7800万美元甚至是1亿美元,双方的成本差距至少是10倍。在性能上,DeepSeek-V3在数学、代码能力和中文知识问答方面还超过了ChatGPT-4,行业震惊于这一性价比,DeepSeek-V3开源给全世界的技术开发团队。

在团队配置上,DeepSeek团队只有139名研发人员,对比ChatGPT的OpenAI团队则有1200名研究人员,团队规模是DeepSeek的近乎9倍之多。近期热门话题“雷军千万年薪挖95后天才AI少女”,这位AI少女就是DeepSeek团队的研发人员,但小米和当事人并未就此回应。

通过招聘网站注意到,深度求索公司的北京子公司正在招人,现共放出了52个岗位,包括深度学习研究员、核心系统研发工程师以及资深UI设计师等,均为14薪。其中,薪资最高的为核心系统研发工程师(校招),薪资范围为6万元-9万元;除此之外,大部分岗位的起薪在2万元及以上。值得一提的是,该公司正在招聘实习生,AGI大模型实习生的工资为500元/天-1000元/天,数据百晓生实习生为500元/天-510元/天。

1月27日,DeepSeek概念股表现强势,截至发稿,每日互动、华金资本、浙江东方涨停,并行科技、卓创资讯、拓尔思等涨幅居前。消息面上,此前AMD宣布,已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上,该模型旨在与SGLang一起实现最佳性能。

华经产业研究院报告显示,2023年国内智能体市场规模达59.81亿元,预计2024年突破百亿元。中国工程院院士邬贺铨表示,2025年不仅是智能体的元年,也将是AI终端的元年。

责任编辑:张小花 TT1000

主题测试文章,只做测试使用。发布者:广众网,转转请注明出处:https://www.zmdnky.org.cn/article/7257.html

(0)
广众网的头像广众网
上一篇 2025年1月27日 下午3:45
下一篇 2025年1月27日 下午4:44

相关推荐

  • 西安初雪大熊猫撒欢玩雪 萌态可掬乐翻天

    1月25日,西安迎来了2025年的第一场雪。在秦岭野生动物园里,大熊猫显得格外兴奋,开启了雪中“撒欢”模式。它们一会儿打滚儿嬉戏,一会儿玩雪卖萌,在大雪中尽情玩耍,萌态可掬,仿佛终于等来了这场久违的雪。 责任编辑:张小花 TT1000

    2025年1月26日
    7200
  • 《美国队长4》上映首日表现平淡 口碑遇冷引发讨论

    《美国队长4》作为2025年首部登陆大银幕的漫威电影,于2月14日上映。该片不仅吸引了众多漫威粉丝观看零点场,还成为情人节情侣约会的选择。然而,首批观众的反馈并不乐观,很多人认为这部电影“无聊”,甚至有人表示“果然《复联4》之后再无漫威”。 《美国队长4》被视为漫威宇宙复兴的关键之作,但自《复仇者联盟4》后,漫威电影似乎陷入了瓶颈。影片中,山姆·威尔逊正式接…

    2025年2月15日
    13800
  • 国乒亚洲杯训练 备战深圳大运中心

    乒乓球亚洲杯将于2月19日至23日在深圳大运中心体育馆举行。国乒运动员们正在进行适应场地的训练,其中包括王楚钦、林诗栋、梁靖崑、林高远、陈垣宇、黄友政、孙颖莎、王曼昱、王艺迪、陈幸同、蒯曼和石洵瑶等人。他们正在积极备战,为即将到来的比赛做好充分准备。 责任编辑:张小花 TT1000

    2025年2月17日
    5100
  • 荷兰德伦特博物馆大门被炸开 国宝级文物被盗

    荷兰北部城市阿森发生了一起严重的盗窃案。窃贼炸开了德伦特博物馆的大门,盗走了正在展出的多件罗马尼亚文物,其中包括一顶被视为国宝的头盔。失窃的文物还包括三个黄金手镯,这些物品均来自罗马尼亚国家历史博物馆。被盗头盔制作于公元前450年,装饰精美,具有极高的文化价值。 根据监控视频显示,三名身着帽衫的人在博物馆大门处引爆炸药实施盗窃。警方在25日凌晨三四点钟接到报…

    2025年1月28日
    11000
  • 澡堂垮塌致2死 遇难者家属:系违建 事故原因调查中

    2025年2月14日19时20分,河南沈丘县刘庄店镇街上一居民自建房浴池发生局部垮塌。当地迅速组织应急救援队伍开展救援,现场搜救出5名受伤群众。其中2人因伤势过重抢救无效不幸身亡,3人正在医院接受治疗,目前伤情稳定。 事故原因调查及善后工作正在进行中。 责任编辑:张蕾

    2025年2月15日
    7300

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信