9 月 13 日,2025 Inclusion・外滩大会「开源嘉年华」正在限量报名中! 了解详情
写点什么

DeepSeek 除夕炸场!发布开源多模态大模型,击败 OpenAI DALL-E 3

  • 2025-01-28
    北京
  • 本文字数:1017 字

    阅读完需:约 3 分钟

大小:505.87K时长:02:52
DeepSeek除夕炸场!发布开源多模态大模型,击败OpenAI DALL-E 3

这个除夕,所有的聚光灯理应给到 DeepSeek。


刚刚,人工智能社区 Hugging Face 显示,DeepSeek 刚刚发布了开源多模态人工智能(AI)模型 Janus-Pro,这是一款基于 DeepSeek-LLM-1.5b-base 和 DeepSeek-LLM-7b-base 构建的模型。在这系列模型中,Janus-Pro-7B 在 GenEval 和 DPG-Bench 基准测试中击败了 OpenAI 的 DALL-E 3 和 Stable Diffusion。



GitHub 项目地址:https://github.com/deepseek-ai/Janus?tab=readme-ov-file

HuggingFace 项目地址:https://huggingface.co/deepseek-ai/Janus-Pro-1B


据悉,Janus-Pro 是一种创新的自回归框架,旨在统一多模态理解与生成任务。它通过将视觉编码解耦为独立的路径,同时仍采用单一的统一 Transformer 架构进行处理,从而解决了以往方法的局限性。这种解耦不仅缓解了视觉编码器在理解与生成任务中的角色冲突,还增强了框架的灵活性。值得一提的是,Janus-Pro 超越了以往的统一模型,还在性能上媲美甚至超越了针对特定任务设计的模型。


Janus-Pro 的发布在网上引发了轩然大波,但也有网友认为,Janus-Pro 虽然在基准测试中赢了 DALL-E 3,但基准测试毕竟不等于实际应用,DPG-Bench 看重生成质量和理解能力,实际用起来效果还得看落地表现。



具体来说,Janus-Pro-7B 在多模态理解基准 MMBench 上取得了 79.2 的分数,超越了 Janus (69.4)、TokenFlow (68.9)等最先进的统一多模态模型,和 MetaMorph (75.2)。此外,在文本到图像指令跟踪排行榜 GenEval 中,Janus-Pro-7B 得分为 0.80,优于 Janus (0.61)、DALL-E 3 (0.67) 和 Stable Diffusion 3 Medium(0.74)。



Janus-Pro-7B 在 GenEval 上获得了 80% 的总体准确率,这优于所有其他统一或仅生成的方法,例如 Transfusion (63%) SD3-Medium (74%) 和 DELLE-E 3 (67%)。这表明我们的方法具有更好的指令跟踪能力。另外,Janus-Pro 在 DPG-Bench 上获得了 84.19 的分数,超过了所有其他方法。这表明 Janus-Pro 擅长遵循密集的指令来生成文本到图像。


在多模态理解方面,它使用 SigLIP-L 作为视觉编码器,支持 384x384 的图像输入。在图像生成方面,Janus-Pro 使用了来源于此的分词器(tokenizer),其下采样率为 16。


但值得一提的是,由于太过火爆,DeepSeek 现在已经限制国外新用户注册了,海外用户需要购买虚拟账号注册方能使用。


DeepSeek 在其官方公告中表示:近期 DeepSeek 线上服务受到大规模恶意攻击,为持续提供服务,暂时限制了+86 手机号以外的注册方式已注册用户可以正常登录,感谢理解和支持。


最后,祝大家新春快乐!

2025-01-28 09:5120528
用户头像
李冬梅 加V:busulishang4668

发布了 1150 篇内容, 共 769.9 次阅读, 收获喜欢 1282 次。

关注

评论

发布
暂无评论

我国数字经济创稳中求进

芯盾时代

数字经济

使用贪心算法解决最小生成树问题

威哥爱编程

Python 算法

Cisco ACI Simulator 6.1(2g) - ACI 模拟器

sysin

ACI

mac系统克隆工具 Clone X for Mac v4.3.2激活版

Rose

Mac ftp文件传输工具 SecureFX注册激活版

Rose

CHM Viewer Star for mac(CHM阅读器)v6.3.4直装激活版

Rose

苹果Mac受欢迎的翻译工具 iTranslate中文版

Rose

Mac解压缩zip工具 Unzip Expert-Zip file tool for Mac v1.4.0激活版

Rose

荣耀换帅,一艘AI巨轮的舵手更替会带来什么?

脑极体

AI

AI英语阅读理解APP的主要功能

北京木奇移动技术有限公司

软件外包公司 AI口语练习 AI英语练习

Seata 源码

京东科技开发者

linux分区数据读取工具 Paragon extFS for Mac v11.3.30永久激活版

Rose

Native Instruments Traktor Pro破解版(数字DJ音乐制作平台)-Mac/win

Rose

Omnissa Secure Email Gateway 2.31 - 电子邮件网关

sysin

horizon

大数据平台Bug Bash大扫除最佳实践

京东科技开发者

分布式日志追踪ID实战

京东科技开发者

分布式系统架构8:分布式缓存

卷福同学

Java redis 分布式 后端 分布式缓存

一文让你清楚的知道互联网时代数据的重要性-行云管家

行云管家

数据安全 数据智能化 数据的重要性

ClkLog埋点用户分析系统支持手机端查询统计数据

ClkLog

开源 数据分析 埋点 sdk 用户画像

McAfee Endpoint Security for Mac(迈克菲防病毒软件)v10.7.8激活版

Rose

Ample Sound Ample Guitar Stratocaster for Mac(电吉他音源)v3.1.0 激活版

Rose

Little Snitch 4 for Mac(小飞贼系统防火墙软件) v4.4.3稳定激活版

Rose

内部信息流出!37天GeeLark云手机直接薅!!

kookeey代理严选

亚马逊运营 跨境电商运营 海外IP代理 Tiktok shop 指纹浏览器

苹果电脑装机必备精美日历软件:CalendarX for mac

Rose

Parallels Toolbox for mac(工具箱合集)v7.0.0商业版

Rose

DeepSeek除夕炸场!发布开源多模态大模型,击败OpenAI DALL-E 3_生成式 AI_李冬梅_InfoQ精选文章