最壕的DeepSeek玩家:10多万元买8台Mac、显存达496GB

DeepSeek-R1,正在接受全球网友真金白银的检验。

花30秒用manim代码制作解释勾股定理的动画,一次完成无错误。

最壕的DeepSeek玩家:10多万元8台Mac、显存达496GB

为了玩上这样的模型,有人花上10多万元,组7台M4 Pro Mac mini+1台M4 Max Macbook Pro的家用超算。

最壕的DeepSeek玩家:10多万元8台Mac、显存达496GB

总计496G显存(64*7+48),才能跑起个4bit量化版,但属实算得上“家用AGI”配置了。

最壕的DeepSeek玩家:10多万元8台Mac、显存达496GB

另一个极端是选择R1数据蒸馏版Qwen 1.5B小模型,小到浏览器就能跑,每秒能输出60个tokens。

最壕的DeepSeek玩家:10多万元8台Mac、显存达496GB

与此同时,各种榜单也在抓紧测试,纷纷跑出了结果。

R1正横扫各大榜单。

首先是LiveBench,与LiveCodeBench一样,题目是随时间更新的,所以相对受认可。

R1的表现在o1-preview到o1之间,其中只有数据一项超过o1。

最壕的DeepSeek玩家:10多万元8台Mac、显存达496GB

不过再带上成本成本约1/30这个条件看,又是不一样的感觉,给老哥整无语了。

唯一的抱怨是上下文窗口太短。

最壕的DeepSeek玩家:10多万元8台Mac、显存达496GB

o1系列一战成名的ARC-AGI,测试结果分为公开数据和私有数据两部分。

DeepSeek R1在私有数据上解决了15.8%的问题,与DeepSeek-V3相比翻倍还多。

公开数据上更是解决了20.5%的问题,与DeepSeek-V3相比上涨约46%。

最壕的DeepSeek玩家:10多万元8台Mac、显存达496GB

总的来看,DeepSeek-R1表现与o1-preview相近,但稍低。

最壕的DeepSeek玩家:10多万元8台Mac、显存达496GB

但同样,带上几毛钱就能解决一道题,o1系列至少要10块钱这个背景来看,又是不一样的感觉。

最壕的DeepSeek玩家:10多万元8台Mac、显存达496GB

考验任务规划能力的PlanBench,同样的剧本再次上演。

最壕的DeepSeek玩家:10多万元8台Mac、显存达496GB

在开发者Xeophon自己的个人测试上,甚至超过了o1-preview。

最壕的DeepSeek玩家:10多万元8台Mac、显存达496GB

同一个测试上,R1数据蒸馏的Qwen 32B,与DeepSeek-V3,GPT-4o和Gemini Flash处于同一水平。

最壕的DeepSeek玩家:10多万元8台Mac、显存达496GB

最后,还有人从中看到新的创业机会。

谁来构建一个平台,能轻松地在DeepSeek R1上进行OpenAI风格的强化微调。

至少在短期内,是一个巨大的机会。

R1在正确数据和微调方法下,可能在特定任务上大幅提升。

最壕的DeepSeek玩家:10多万元8台Mac、显存达496GB

参考链接:

[1]https://x.com/alexocheema/status/1881561143736664180

[2]https://x.com/reach_vb/status/1881809400995934640

[3]https://livebench.ai/#/[2]https://x.com/arcprize/status/1881761987090325517

[4]https://x.com/TheXeophon/status/1881443117787984265

责任编辑:上方文Q

主题测试文章,只做测试使用。发布者:广众网,转转请注明出处:https://www.zmdnky.org.cn/article/5654.html

(0)
广众网的头像广众网
上一篇 2025年1月22日 下午6:17
下一篇 2025年1月22日 下午6:17

相关推荐

  • 通信强的飞起!华为Mate 70 Pro+北斗短信/定位获中国移动评测五星 排名第一

    广众网1月21日消息,在华为的引领下,主流手机厂商目前纷纷加入卫星通信赛道,各家体验到底如何? 日前,中国移动2024年智能硬件质量报告发布,华为Mate70 Pro+在手机北斗短信评测及北斗定位评测综合评价五星,排名第一,通信体验强得飞起。 在手机北斗短信评测中,华为Mate70 Pro+、荣耀Magic7 Pro、vivo X200 Pro三款机型在搜星…

    2025年1月21日
    6800
  • 曝华为Pura 80系列最快5月登场:最强鸿蒙影像旗舰

    广众网1月23日消息,博主定焦数码表示,华为Pura 80系列预计在5月或6月登场,对比同期的Pura 70系列要晚点(华为Pura 70系列是2024年4月上市的产品)。 据爆料,华为Pura 80 Ultra将首发全新的1英寸主摄,这是华为与另外一家国产CIS厂商合作打造的图像传感器,有很多自主研发的核心技术在里面。 与此同时,华为Pura 80 Ult…

    2025年1月23日
    7100
  • 蒋欣春晚彩排:新中式羽绒服格外抢眼

    1月23日消息,据媒体报道,近日,演员蒋欣现身春晚第4次彩排现场,意外带火新中式红色羽绒服。 有网友表示,这件衣服太美了,可以买来当新年战袍了。 值得注意的是,蒋欣同款羽绒服在各大电商平台上变成热搜词,引发关注。 公开报道显示,1月22日央视春晚完成了第4次彩排,歌曲、舞蹈、戏曲、小品等节目匠心独运、精彩纷呈,演员们状态热情饱满,整台晚会衔接更流畅,各工种配…

    2025年1月23日
    21300
  • 575W超高功耗!RTX 50系列删除最热的Hot Spot温度

    广众网1月24日消息,在评测RTX 5090D的过程中(今晚解禁),我们发现,GPU-Z传感器面板的Hot Spot热点温度显示异常,一直都是255℃,很自然地以为这是GPU-Z尚未支持到位所致,并未在意。 不过,GPU-Z的作者Wizzard最新确认,其实在Blackwell RTX 50系列上,NVIDIA已经删除了Hot Spot的传感器。 后续,GP…

    2025年1月24日
    5300
  • 苹果官网又现低级错误!iPhone竟写错成“iPone”

    广众网1月21日消息,作为全球影响力最大的科技公司之一,苹果官网却经常出现低级错误。 日前,有网友发现,苹果中国官网的“如何下载iOS 18”支持页面中出现错别字,在介绍机型兼容的部分,苹果将“iPhone”写成了“iPone”。 有网友表示,“苹果作为行业巨头,在自家官网出现这种低级失误,实在有点影响形象。” 事实上,苹果官网并不是第一次出现这种低级错误,…

    2025年1月21日
    6000

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信