Deepseek被“挤”到宕机!创始人17岁考入浙大 国产AI崛起引发全球关注

几乎是一夜之间,“来自东方的神秘力量”又一次震撼了海外人士。1月27日,由国产大模型公司杭州深度求索开发的Deepseek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。

Deepseek被“挤”到宕机!创始人17岁考入浙大

1月27日,DeepSeek官网显示,DeepSeek网页/API不可用。前一天,DeepSeek曾出现短时闪崩现象。对此,DeepSeek回应称,当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求。

Deepseek被“挤”到宕机!创始人17岁考入浙大 国产AI崛起引发全球关注

Deepseek来自国产大模型公司深度求索,系量化巨头幻方量化旗下大模型公司。1月20日,该公司正式发布推理大模型DeepSeek-R1。一经推出,DeepSeek-R1便凭借其“物美价廉”的特性在海外开发者社区中引发了轰动。

Deepseek被“挤”到宕机!创始人17岁考入浙大 国产AI崛起引发全球关注

今年1月20日,国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会,听取对《政府工作报告(征求意见稿)》的意见建议。DeepSeek创始人梁文锋参加此次座谈会,他既是深度求索(DeepSeek)创始人,也是头部量化私募幻方的创始人,创业范畴横跨金融和人工智能领域。

Deepseek被“挤”到宕机!创始人17岁考入浙大 国产AI崛起引发全球关注

在校期间,梁文锋对金融市场产生了浓厚的兴趣。特别是在2008年全球金融危机之际,他带领团队探索了机器学习技术在全自动量化交易中的应用潜力,这一经历为他日后的职业生涯奠定了坚实的基础。毕业后,他将目光转向更广阔的金融市场。

Deepseek被“挤”到宕机!创始人17岁考入浙大 国产AI崛起引发全球关注

2013年,梁文锋与浙大同学徐进共同创立了杭州雅克比投资管理有限公司,两年后又成立了杭州幻方科技有限公司,致力于通过数学和人工智能进行量化投资。2015年的市场波动中,幻方依靠先进的高频量化策略取得了令人瞩目的成绩。2016年是幻方的重要转折点,这一年,公司推出了首个基于深度学习的交易模型,并实现了所有量化策略的AI化转型。2018年,幻方正式确立了以AI为核心的发展战略。然而,随着业务的快速扩展,算力瓶颈逐渐显现。

Deepseek被“挤”到宕机!创始人17岁考入浙大 国产AI崛起引发全球关注

为解决计算资源不足的问题,2019年,梁文锋带领团队自主研发了“萤火一号”训练平台,总投资近2亿元,搭载了1100块GPU。两年后,“萤火二号”的投入增加到10亿元,搭载了约1万张英伟达A100显卡。2021年,幻方的资产管理规模突破千亿大关,跻身国内量化私募领域的“四大天王”之列。2023年,他宣布将正式进军通用人工智能领域,并创办了深度求索DeepSeek,专注于做真正人类级别的人工智能。

2024年5月,DeepSeek发布混合专家语言模型DeepSeek-V2。同年12月,DeepSeek-V3问世,这款性能优越且性价比极高的大语言模型被硅谷同行誉为“来自东方的神秘力量”。DeepSeek之所以受到科技圈关注,在于DeepSeek-V3的出现极大地降低了大模型训练和应用的成本,DeepSeek-V3训练成本仅557.6万美元,而OpenAI训练ChatGPT-4所花费的成本高达7800万美元甚至是1亿美元,双方的成本差距至少是10倍。在性能上,DeepSeek-V3在数学、代码能力和中文知识问答方面还超过了ChatGPT-4,行业震惊于这一性价比,DeepSeek-V3开源给全世界的技术开发团队。

在团队配置上,DeepSeek团队只有139名研发人员,对比ChatGPT的OpenAI团队则有1200名研究人员,团队规模是DeepSeek的近乎9倍之多。近期热门话题“雷军千万年薪挖95后天才AI少女”,这位AI少女就是DeepSeek团队的研发人员,但小米和当事人并未就此回应。

通过招聘网站注意到,深度求索公司的北京子公司正在招人,现共放出了52个岗位,包括深度学习研究员、核心系统研发工程师以及资深UI设计师等,均为14薪。其中,薪资最高的为核心系统研发工程师(校招),薪资范围为6万元-9万元;除此之外,大部分岗位的起薪在2万元及以上。值得一提的是,该公司正在招聘实习生,AGI大模型实习生的工资为500元/天-1000元/天,数据百晓生实习生为500元/天-510元/天。

1月27日,DeepSeek概念股表现强势,截至发稿,每日互动、华金资本、浙江东方涨停,并行科技、卓创资讯、拓尔思等涨幅居前。消息面上,此前AMD宣布,已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上,该模型旨在与SGLang一起实现最佳性能。

华经产业研究院报告显示,2023年国内智能体市场规模达59.81亿元,预计2024年突破百亿元。中国工程院院士邬贺铨表示,2025年不仅是智能体的元年,也将是AI终端的元年。

责任编辑:张小花 TT1000

文章来源于网络。发布者:广众网,转转请注明出处:https://www.zmdnky.org.cn/article/7257.html

(0)
广众网的头像广众网
上一篇 2025年1月27日 下午3:45
下一篇 2025年1月27日 下午4:44

相关推荐

  • 疫苗供应量稳定 北京9至26岁男性HPV疫苗接种已开启 促进男女共防

    2月14日,以“和合共生,健康共护”为主题的“HPV男女共防计划”圆桌会在北京航天中心医院举行。会上提到,北京地区已正式开通适龄男性预约接种HPV疫苗的官方平台。 相较于女性,男性HPV感染较少受到关注。实际上,在全球范围内,男性生殖器HPV感染率高于女性。公众对男性HPV感染的认知不足,存在许多误区,如认为男性感染HPV没有危害或后果不严重、HPV感染只引…

    2025年2月18日
    9800
  • 台风丹娜丝来袭,粤东沿海风雨交加需警惕

    今年第4号台风“丹娜丝”于7月6日强度持续增大,影响了广东海上和粤东沿海市县,带来大风和强降雨。同时,广东省其他地区则出现高温天气。 “丹娜丝”在6日5时由强热带风暴级加强为台风级,8时中心位于汕头东南方约230公里的南海东北部海面上,中心附近最大风力达到12级,十级风圈半径约为50至60公里。截至6日11时50分,全省有16个台风预警信号生效中,其中汕头南…

    2025年7月6日
    2900
  • 北京今天白天晴,北转南风二三级,最高气温6℃ 天干物燥注意防火

    北京市气象台18日6时发布天气预报。今天是雨水节气,白天晴朗,北风转南风二到三级,山区阵风可达五到六级,最高气温6℃。夜间天气由晴转为多云,南风转北风二到三级,最低气温降至-4℃。天干物燥,提醒大家注意用火用电安全。 责任编辑:于浩淙 zx0176

    2025年2月18日
    9200
  • 妻子与人合拍短视频被丈夫砍伤 家庭悲剧引深思

    妻子与人合拍短视频被丈夫砍伤。黄师傅的家位于贵阳市花溪区高坡乡的一片宁静之地,平时他和妻子邵阿姨相依为命,过着平淡而温馨的生活。然而,最近家中只剩下黄师傅一人,邵阿姨不再愿意踏入家门。 黄师傅和邵阿姨年少时相识,共同走过了四十多个春秋。虽然他们的生活并不总是甜蜜如蜜,但彼此扶持度过了许多风风雨雨,成为了对方生活中不可或缺的人。 平静的生活因一个意外而被打破。…

    2025年2月10日
    12800
  • 京东为何要与美团饿了么抢蛋糕 主打品质外卖

    京东为何要与美团饿了么抢蛋糕。随着AI技术的不断发展,互联网行业始终保持着快速变化的步伐。无论是企业积极拥抱AI技术,还是对现有市场份额的重新划分,都体现了这一趋势。 在短视频领域,腾讯和字节跳动的竞争尚未平息,视频号又在短视频赛道上开辟了新的战场。与此同时,京东宣布进入外卖市场,启动「品质堂食餐饮商家」招募计划,并承诺2025年5月1日前入驻的商家全年免佣…

    2025年2月13日
    27800

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信