2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

小团队高 ROI,中国团队自研 AI 图像生成大模型迈入全球第一梯队

  • 2025-04-25
    北京
  • 本文字数:593 字

    阅读完需:约 2 分钟

小团队高ROI,中国团队自研 AI 图像生成大模型迈入全球第一梯队

本月,就在大家还在为 GPT-4o 惊艳的生图、改图能力刷屏时,一个来自中国合肥的开源模型,悄然冲上了全球 AI 图像生成的第一梯队。

截图源自 Hugging Face(截止 4 月 24 日)


它叫 HiDream-I1,由初创公司「智象未来」打造:

  • Hugging Face 文生图模型趋势榜第一;Artificial Analysis 榜单上第三(截止 4 月 24 日)

  • 关键是,它是完全开源 + 可商用 + 支持部署的国产模型


据悉,HiDream.ai 智象未来团队规模仅 50 人左右,却已构建出业内领先的多模态版权语料库,并将模型训练 ROI 优化至业内平均水平的 1/5,可谓“小团队高 ROI”。


令人期待的是,交互式图像编辑大模型 HiDream-E1 也即将在近期开源。据官方介绍,它与 HiDream-I1 一起,真正实现“言出法随”。二者将图像的生成、理解和交互式编辑都融入到对话大模型中,让用户可以用对话聊天的形式来生成图片,并使用自然语言对图片内容进行相应的编辑,这是图像生成功能的又一次升级,进一步降低了使用 AIGC 工具进行创作的门槛。


InfoQ 非常荣幸地邀请到了智象未来算法科学家潘滢炜,他将于 6 月 27-28 日在 AICon 北京站上带来精彩分享:

演讲主题:多模态内容生成:从技术突破到创新应用落地

看点抢先看👇

  • 多模态内容生成技术的前沿动态

  • 智象多模态大模型的关键技术升级

  • 多模态生成如何赋能设计、营销、影视、文旅等应用场景

  • 不做等风来的人:在多模态还没到 100 分之前,如何抓住“做应用”的黄金窗口,用技术打通内容创作的“最后一公里”



2025-04-25 17:098682

评论

发布
暂无评论
发现更多内容

Athena雅典娜交易所系统开发|Athena雅典娜交易所软件APP开发

系统开发

破51项国际榜单纪录!解读华为云擎天架构调度求解引擎

华为云开发者联盟

华为 架构 华为云

没弄懂这些Java基础,简历上千万别写熟悉:异常+反射+注解+泛型

小Q

Java 学习 编程 面试 基础

一个改变世界的“箱子”

阿里巴巴云原生

Docker 阿里云 容器 云原生 k8s

快来!开源一份阿里微服务指导手册:springBoot+springCloud+MQ

小Q

学习 面试 微服务 MQ SpringCloud

网络入门模拟器:Cisco Packet Tracer 实验教程

BAT等大厂面试复习资料文档整理:ActiveMQ+redis+Spring+高并发多线程+JVM

Java架构之路

Java 程序员 架构 面试 编程语言

互联网新规鼓励保险与大数据、区块链等新技术融合!业内呼吁配套产品管理制度尽快出炉

CECBC

互联网金融

工作日志:一文总结HBase从搭建到实操,大家一起进步

小Q

大数据 学习 编程 面试 HBase

盘点 2020 | 坚持写技术博客一年能有多少收获!

小傅哥

Java 小傅哥 技术人 盘点2020

手把手教你免费获取正版 Jetbrains 全家桶 License

郭旭东

ide JetBrains

C语言服务器编程必备常识

MySQL从删库到跑路

c

社区团购大战升级:零售行业再次面临挑战

石头IT视角

聚焦LS-MIMO的四大层面,浅谈5G关键技术

华为云开发者联盟

华为 5G 华为云

即构SDK12月迭代:新增多项质量回调,互动白板、云录制SDK同步更新

ZEGO即构

BATJ面试常被问到的100+题:Spring+微服务+SpringMVC+MyBatis

Java架构之路

Java 程序员 架构 面试 编程语言

探营苏州数字人民币试点

CECBC

数字人民币

第三代人工智能基础设施背后,是一次技术应用的常识普及运动

脑极体

海淀区政府携手百度,打造数字政务时代新门户

DT极客

SpringBoot魔法堂:应用热部署实践与原理浅析

设计原则 框架 spring Boot Starter

有了Git这个功能,再也不需要依赖IDE了!

编程 架构

你只修改了2行代码,为什么需要两天时间?

Java架构师迁哥

终于学完了阿里云大数据架构师推荐的Flink入门与实战PDF

小Q

大数据 flink 学习 编程 面试

LeetCode题解:429. N叉树的层序遍历,BFS,JavaScript,详细注释

Lee Chen

算法 大前端 LeetCode

阿里三面惨遭被虐,spring,jvm,mybatis,并发编程等一窍不通

Java架构之路

Java 程序员 架构 面试 编程语言

赶紧看!阿里架构师必备“绝杀版”Tomact架构笔记堪称绝技

比伯

Java tomcat 编程 架构 程序人生

终于有人通过笔记+脑图+视频的模式把Spring源码讲明白了

Java架构追梦

Java 学习 架构 面试 spring源码

我叫你不要重试,你非得重试。这下玩坏了吧?

比伯

Java 编程 架构 面试 程序人生

基于LiteOS Studio零成本学习LiteOS物联网操作系统

华为云开发者联盟

操作系统 物联网 华为云

XMEX交易所系统软件开发|XMEX交易所APP开发

系统开发

如何在软件发布计划中自动化语义化版本与变更日志

华为云开发者联盟

自动化 工具 发布

小团队高ROI,中国团队自研 AI 图像生成大模型迈入全球第一梯队_AI&大模型_罗燕珊_InfoQ精选文章