DeepSeek深夜发新品 跑分力压OpenAI 图像生成新突破

中国公司DeepSeek在华尔街周一紧张评估“DeepSeek风暴”时,推出了新产品:开源的多模态大模型Janus-Pro。这款模型在图像生成基准测试中超越了OpenAI的DALL-E 3。

DeepSeek深夜发新品 跑分力压OpenAI

除夕夜前夕,DeepSeek工程师们在“抱抱脸”平台上发布了Janus Pro 7B和1.5B模型,这是对去年10月发布的Janus模型的升级。这两个模型分别具有15亿和70亿参数量,可以在消费级电脑上本地运行。与之前的版本一样,Janus Pro采用MIT许可证,在商用方面没有限制。

DeepSeek深夜发新品 跑分力压OpenAI 图像生成新突破

据介绍,Janus-Pro采用了新颖的自回归框架,统一了多模态理解和生成。通过将视觉编码分为“理解”和“生成”两条路径,并使用单一的Transformer架构处理,解决了以往方法的局限性。这种设计不仅缓解了视觉编码器在理解和生成中的角色冲突,还提高了框架的灵活性。

DeepSeek深夜发新品 跑分力压OpenAI 图像生成新突破

从报告给出的数据来看,Janus-Pro 70亿参数模型在部分文生图基准测试中表现优于OpenAI的DALL-E 3和Stability AI的Stable Diffusion 3-Medium。尽管DALL-E 3是2023年发布的老模型,且Janus Pro目前只能分析和生成较小规格的图像(384 x 384),但其性能仍然令人印象深刻。

DeepSeek深夜发新品 跑分力压OpenAI 图像生成新突破

技术报告显示,Janus-Pro在视觉生成方面通过添加7200万张高质量合成图像,使得真实数据与合成数据的比例达到1:1,从而实现更具视觉吸引力和稳定性的图像输出。此外,新模型在多模态理解的训练数据方面参考了DeepSeek VL2并增加了约9000万个样本。

DeepSeek深夜发新品 跑分力压OpenAI 图像生成新突破

作为多模态模型,Janus-Pro不仅可以“文生图”,还能对图片进行描述、识别地标景点(如杭州西湖)、识别图像中的文字,并能介绍图片中的知识(例如“猫和老鼠”蛋糕)。公司也在报告中展示了更多图像生成的案例。

责任编辑:于浩淙 zx0176

文章来源于网络。发布者:广众网,转转请注明出处:https://www.zmdnky.org.cn/article/7337.html

(0)
广众网的头像广众网
上一篇 2025年1月28日 上午3:44
下一篇 2025年1月28日 上午7:45

相关推荐

  • 王浩文拐卖儿童案二审维持死刑 主犯不认罪

    1月21日下午,四川省高院对王浩文拐卖儿童案二审宣判,维持一审的死刑判决。王浩文到案后拒不认罪,不配合查找被拐儿童,毫无悔罪表现,被认为人身危险性极大,属于极少数罪行极其严重的犯罪分子,应予严惩。其妻子胡某雄经电话通知到案后如实供述犯罪事实,系自首,减轻处罚;前女友王某琼到案后如实供述犯罪事实,系坦白从轻处罚。二人自愿认罪认罚,依法从宽处理。 此前,南充中院…

    2025年1月23日
    9100
  • 援助物资将抵达加沙地带 卡车排队通过拉法口岸

    1月19日,运送援助物资的卡车在拉法口岸埃及一侧等待进入加沙。尼罗河电视台的画面显示,这些卡车排起长队,随后陆续通过口岸。 据埃及红新月会的消息,这些运送援助物资的车辆将在经过以色列方面的检查后抵达加沙。 责任编辑:张佳鑫 0764

    2025年1月20日
    11900
  • 数据帝:杜兰特一壮举比肩詹皇 16分钟飙7三分!悍将成历史第四人 NBA多队刷新纪录

    北京时间2月10日,NBA常规赛进行了三场比赛。在这些比赛中,利拉德、马克西、坎宁安和阿门-汤普森等球员表现出色,创造了多项个人纪录。 雄鹿以135-127击败76人,利拉德在这场比赛中27投14中,三分球15投8中,贡献了43分7篮板8助攻。这一表现使他成为队史第一位单场拿到43+7+8+8三分的球员。 尽管76人不敌雄鹿,但马克西的表现依然抢眼。他23投…

    2025年2月12日
    10000
  • 奇事!美国超市冷藏柜拉出一只活狼 在场顾客惊呆了

    近日,美国芝加哥Aldi超市发布公告称,超市冷藏柜中有只狼,当警方赶到现场后用工具将狼抓住,有人录下抓捕视频发在网上,引发网友热烈讨论。 当时,超市求助警方,表明店内疑似有只狗或浣熊躲在食物冷藏柜,担心危险希望前往协助抓捕。 视频显示,芝加哥一名警察拿着工具戳进食物冷藏柜晃动,数秒后手伸入冷藏柜抓住动物尾巴,接着抓紧尾巴用力往后一拉,竟出现一只灰色的狼。狼被…

    2025年2月5日
    10400
  • 赛道Hyper | DeepSeek:算力需求的潜在逻辑

    1月27日,英伟达美股盘前深度下跌超过12%,跌破了2024年12月17日的126.86美元低点。黄仁勋可能没想到,撼动英伟达产业逻辑的是一家中国私募。 1月20日,管理基金规模超过1000亿元的中国顶级私募——幻方量化旗下公司“深度求索”推出了推理大模型DeepSeek-R1(以下简称DS-R1)。该模型以超低训练成本和不亚于OpenAI o1正式版的性能…

    2025年1月29日
    17000

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信