2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

小团队高 ROI,中国团队自研 AI 图像生成大模型迈入全球第一梯队

  • 2025-04-25
    北京
  • 本文字数:593 字

    阅读完需:约 2 分钟

小团队高ROI,中国团队自研 AI 图像生成大模型迈入全球第一梯队

本月,就在大家还在为 GPT-4o 惊艳的生图、改图能力刷屏时,一个来自中国合肥的开源模型,悄然冲上了全球 AI 图像生成的第一梯队。

截图源自 Hugging Face(截止 4 月 24 日)


它叫 HiDream-I1,由初创公司「智象未来」打造:

  • Hugging Face 文生图模型趋势榜第一;Artificial Analysis 榜单上第三(截止 4 月 24 日)

  • 关键是,它是完全开源 + 可商用 + 支持部署的国产模型


据悉,HiDream.ai 智象未来团队规模仅 50 人左右,却已构建出业内领先的多模态版权语料库,并将模型训练 ROI 优化至业内平均水平的 1/5,可谓“小团队高 ROI”。


令人期待的是,交互式图像编辑大模型 HiDream-E1 也即将在近期开源。据官方介绍,它与 HiDream-I1 一起,真正实现“言出法随”。二者将图像的生成、理解和交互式编辑都融入到对话大模型中,让用户可以用对话聊天的形式来生成图片,并使用自然语言对图片内容进行相应的编辑,这是图像生成功能的又一次升级,进一步降低了使用 AIGC 工具进行创作的门槛。


InfoQ 非常荣幸地邀请到了智象未来算法科学家潘滢炜,他将于 6 月 27-28 日在 AICon 北京站上带来精彩分享:

演讲主题:多模态内容生成:从技术突破到创新应用落地

看点抢先看👇

  • 多模态内容生成技术的前沿动态

  • 智象多模态大模型的关键技术升级

  • 多模态生成如何赋能设计、营销、影视、文旅等应用场景

  • 不做等风来的人:在多模态还没到 100 分之前,如何抓住“做应用”的黄金窗口,用技术打通内容创作的“最后一公里”



2025-04-25 17:098836

评论

发布
暂无评论
发现更多内容

一张二维码VS一个行李箱?!看华为云时习知如何助力防城港核电基本安全考试

平平无奇爱好科技

听说测试“有手就行 ”?华为20年测试老兵干货分享!

华为云开发者联盟

物联网 华为云 华为云开发者联盟 DTSE Tech Talk 企业号2024年4月PK榜

解密数仓的SQL ON ANYWHERE技术

华为云开发者联盟

大数据 华为云 SQL语句 华为云开发者联盟 企业号2024年4月PK榜

MySQL的多层SP中Cursor的m_max_cursor_index相关BUG分析

GreatSQL

Dumping grounds

Echo!!!

Expression English

什么是单元测试,和集成测试有什么区别?

派大星

单元测试 Java 面试题 互联网大厂面试

万字长文,聊聊我在京东锦礼成长的这一年

京东零售技术

后端 技术人生 企业号 4 月 PK 榜

解析基础设施即代码:重新定义云管理

SEAL安全

DevOps 云原生 IaC

ShowMeBug李亚飞:IDE与AI自动编程技术将增强超级程序员

B Impact

C++ 条件与 If 语句:掌握逻辑判断与流程控制精髓

小万哥

程序人生 编程语言 软件工程 C/C++ 后端开发

为什么研发规范,代码评审,单元测试推不动

赫杰辉

Penpad Season 2 质押突破350ETH,还有望获Scroll生态空投

鳄鱼视界

深入探索Linux的lsof命令

GousterCloud

Linux

AI大模型微调训练营-毕业总结

简单

对 NGINX、Kong 和 Amazon 的 API 管理解决方案进行基准测试:它们能否交付实时 API?

NGINX开源社区

nginx SaaS API GigaOm Kong Cloud

小团队高ROI,中国团队自研 AI 图像生成大模型迈入全球第一梯队_AI&大模型_罗燕珊_InfoQ精选文章