今年春节,DeepSeek 成为了AI圈的焦点。人们热议这款前所未有的出圈AI产品及其公司,讨论中夹杂着中美竞争、美股暴跌等热门话题,使得DeepSeek被神化或妖魔化。
然而,DeepSeek的研究员们在忙些什么呢?尽管这家公司极其低调,但它鼓励科学家追求学术成就,并以开源为基础进行研究。这些年轻的研究员们在社区里活跃,分享自己的工作和见解。
与那些夸张的文章相比,研究员们的实际分享往往阅读量不高。但对真正想了解DeepSeek的人来说,这些真实的分享更为重要。例如,认证为DeepSeek机器学习和多模态研究员的刘星超,在推特上分享了自己的工作,并与他人互动。他参与开发的多模态模型JanusFlow获得了知名学者的关注,而他的回复也充满了人情味。
这些研究员们经常关注同行的工作,并点赞或提问。在DeepSeek爆火之前,他们的信息常常石沉大海。例如,邵智宏在实习期间成为DeepSeek Math的核心作者之一,后来参与了R1等模型开发。他在推特上点赞并祝贺其他团队,就像普通关注者一样。
随着DeepSeek的名气大增,情况发生了变化。邵智宏发布DeepSeek Coder模型时只有几千阅读量,但R1的成功让他的转发阅读量飙升至几十万。于是,这些简洁明了的学术交流也开始带有能力宣示的意味。
DeepSeek基础设施团队的许哲安在V3因成本引发热议后的一句简单回复也获得了大量关注。他的简介是“基础设施团队里随便一个人”。
这些研究员背景各异,但都展现出对算法的独特理解。Peiyi Wang分享了自己从无强化学习经验到独立推导出统一公式的经历,这种思考方式体现在多个模型中。他一直在与社区交流,分享真实的研究情况。
最近,研究员们共同庆祝了一个时刻:超越ChatGPT。他们转发了DeepSeek应用登顶应用商店的消息,并表达了喜悦之情。对于内部来说,这是一次重要的里程碑。面对OpenAI的蒸馏指控,刘星超做出了回应,强调了DeepSeek的技术实力。
此外,研究员们还忙着辟谣一个冒充梁文锋的虚假账号,显示出公司近期的困扰。郭达雅在推特上分享了关于R1系列模型的一些问答,透露了重要的技术细节和发展方向。这些回答真诚且具体,没有故弄玄虚。
从组织形态来看,DeepSeek是一个扁平化的团队,类似于OpenAI和英伟达。不同层级的研究员可以直接向CEO汇报,跨部门协作也非常灵活。这样的团队结构有助于创新和技术进步。
这些年轻的AI科学家们正在通过自己的努力改变世界,他们的热情和专注让人感到鼓舞。
主题测试文章,只做测试使用。发布者:广众网,转转请注明出处:https://www.zmdnky.org.cn/article/8524.html