写点什么

小团队高 ROI,中国团队自研 AI 图像生成大模型迈入全球第一梯队

  • 2025-04-25
    北京
  • 本文字数:593 字

    阅读完需:约 2 分钟

小团队高ROI,中国团队自研 AI 图像生成大模型迈入全球第一梯队

本月,就在大家还在为 GPT-4o 惊艳的生图、改图能力刷屏时,一个来自中国合肥的开源模型,悄然冲上了全球 AI 图像生成的第一梯队。

截图源自 Hugging Face(截止 4 月 24 日)


它叫 HiDream-I1,由初创公司「智象未来」打造:

  • Hugging Face 文生图模型趋势榜第一;Artificial Analysis 榜单上第三(截止 4 月 24 日)

  • 关键是,它是完全开源 + 可商用 + 支持部署的国产模型


据悉,HiDream.ai 智象未来团队规模仅 50 人左右,却已构建出业内领先的多模态版权语料库,并将模型训练 ROI 优化至业内平均水平的 1/5,可谓“小团队高 ROI”。


令人期待的是,交互式图像编辑大模型 HiDream-E1 也即将在近期开源。据官方介绍,它与 HiDream-I1 一起,真正实现“言出法随”。二者将图像的生成、理解和交互式编辑都融入到对话大模型中,让用户可以用对话聊天的形式来生成图片,并使用自然语言对图片内容进行相应的编辑,这是图像生成功能的又一次升级,进一步降低了使用 AIGC 工具进行创作的门槛。


InfoQ 非常荣幸地邀请到了智象未来算法科学家潘滢炜,他将于 6 月 27-28 日在 AICon 北京站上带来精彩分享:

演讲主题:多模态内容生成:从技术突破到创新应用落地

看点抢先看👇

  • 多模态内容生成技术的前沿动态

  • 智象多模态大模型的关键技术升级

  • 多模态生成如何赋能设计、营销、影视、文旅等应用场景

  • 不做等风来的人:在多模态还没到 100 分之前,如何抓住“做应用”的黄金窗口,用技术打通内容创作的“最后一公里”



2025-04-25 17:098087

评论

发布
暂无评论

语音识别技术在智能门禁系统中的应用与设计

数据堂

存算分离下设计数据库计算引擎的思路

计算引擎 存算分离

copilot使用体验

FunTester

「最新」Rhino 8(犀牛 8)for Mac「三维建模」

彩云

三维建模 Rhino 8

在Linux上玩原神!2023-10月武汉Linux爱好者线下沙龙(WHLUG)活动回顾

nn-30

Linux 操作系统 技术沙龙 deepin WHLUG

大型企业财务共享建设避坑指南之场景化表单设计

用友BIP

财务共享

语音识别技术在智能家居控制系统中的应用与前景

数据堂

抖音双十一,主播“分食”李佳琦

自象限

语雀生产事故不该只是运维的锅

文思源想

运维 产品定位 生产事故 技术感悟 语雀故障

Python 正则表达式(RegEx)指南

小万哥

Python 程序员 软件 后端 开发

如何让 Bean 深度感知 Spring 容器

江南一点雨

Java spring

Topaz Video AI 4.0.2 视频增强和修复工具

彩云

Topaz Video AI

效果不好,为什么?

矩视智能

深度学习 机器视觉

初识inBuilder内存计算模块--业务数据同步

inBuilder低代码平台

数据库

语音识别技术在教育领域的应用与挑战

数据堂

年终总结必备!8款好用的AI制作PPT软件推荐。

彭宏豪95

AI PPT 年终总结 在线白板 AIGC

WorkPlus 局域网即时通讯工具,加速团队协作,提升企业工作效率

BeeWorks

大模型的“成本瘦身”运动

脑极体

AI

Java基础面试题【分布式】

派大星

分布式, Java 面试题

Mac电脑照片拼图软件 CollageIt Pro免激活最新版

胖墩儿不胖y

Mac软件 照片处理工具 照片拼贴软件

2023年APP备案操作教程 阿里云APP备案试列 APP公钥sha1签名获取方法

企业办公为什么要选择局域网im即时通讯软件

BeeWorks

Hexo+Github+Netlify博客搭建教程

Leo

博客

小团队高ROI,中国团队自研 AI 图像生成大模型迈入全球第一梯队_AI&大模型_罗燕珊_InfoQ精选文章