写点什么

小团队高 ROI,中国团队自研 AI 图像生成大模型迈入全球第一梯队

  • 2025-04-25
    北京
  • 本文字数:593 字

    阅读完需:约 2 分钟

小团队高ROI,中国团队自研 AI 图像生成大模型迈入全球第一梯队

本月,就在大家还在为 GPT-4o 惊艳的生图、改图能力刷屏时,一个来自中国合肥的开源模型,悄然冲上了全球 AI 图像生成的第一梯队。

截图源自 Hugging Face(截止 4 月 24 日)


它叫 HiDream-I1,由初创公司「智象未来」打造:

  • Hugging Face 文生图模型趋势榜第一;Artificial Analysis 榜单上第三(截止 4 月 24 日)

  • 关键是,它是完全开源 + 可商用 + 支持部署的国产模型


据悉,HiDream.ai 智象未来团队规模仅 50 人左右,却已构建出业内领先的多模态版权语料库,并将模型训练 ROI 优化至业内平均水平的 1/5,可谓“小团队高 ROI”。


令人期待的是,交互式图像编辑大模型 HiDream-E1 也即将在近期开源。据官方介绍,它与 HiDream-I1 一起,真正实现“言出法随”。二者将图像的生成、理解和交互式编辑都融入到对话大模型中,让用户可以用对话聊天的形式来生成图片,并使用自然语言对图片内容进行相应的编辑,这是图像生成功能的又一次升级,进一步降低了使用 AIGC 工具进行创作的门槛。


InfoQ 非常荣幸地邀请到了智象未来算法科学家潘滢炜,他将于 6 月 27-28 日在 AICon 北京站上带来精彩分享:

演讲主题:多模态内容生成:从技术突破到创新应用落地

看点抢先看👇

  • 多模态内容生成技术的前沿动态

  • 智象多模态大模型的关键技术升级

  • 多模态生成如何赋能设计、营销、影视、文旅等应用场景

  • 不做等风来的人:在多模态还没到 100 分之前,如何抓住“做应用”的黄金窗口,用技术打通内容创作的“最后一公里”



2025-04-25 17:098790

评论

发布
暂无评论
发现更多内容

Doris Summit 2024年度盛会|NineData创始人&CEO叶正盛将出席,围绕「数据实时同步技术实践」展开主题演讲

NineData

NineData Doris Summit Asia 2024 飞轮科技

使用AI机器学习,轻松解决化合物配比优化问题

Altair RapidMiner

人工智能 AI 数据分析、 工业化设计 altair

Metasploit Framework 6.4.40 (macOS, Linux, Windows) - 开源渗透测试框架

sysin

Metasploit

阿里大佬带你一周刷完Java面试八股文,比刷视频效果好多了!

Summer

Java 编程 面试 架构师 大厂

SEO:网站的“流量秘籍”大公开

恩爸编程

搜索引擎 SEO SEO伪静态 SEO工具 SEO 优化

AutoMQ x Iceberg SG Meetup: Table Topic 新特性统一流与分析首次公开

AutoMQ

云计算 kafka iceberg 活动预告 AutoMQ

IoTDB 能源电力解决方案:协助“源网储”数字化智能化转型,构建高质量新型电力系统

Apache IoTDB

2024全球人形机器人领域深度调研和行业前瞻报告

机器人头条

特斯拉 大模型 人形机器人 具身智能

鸿蒙NEXT开发案例:保质期计算

zhongcx

2025年最新Java八股文面试题,面试应该是够用了(吊打面试官)

Summer

Java 程序员 面试 面试题 架构师

百度 SEO:不是玄学,是科学与艺术的 “恋爱”

恩爸编程

搜索引擎 百度 SEO 百度搜索 SEO 优化

Nexpose 7.1.0 for Linux & Windows - 漏洞扫描

sysin

Nexpose

大模型时代人工智能技术的应用趋势

不在线第一只蜗牛

人工智能 大模型

谷歌 Gemini 2.0 支持音频和图像输出;吴恩达:当下最重要的技术是 Agentic AI,视觉 AI 是下个趋势

RTE开发者社区

企业的海外网络访问需求怎么解决?

Ogcloud

SD-WAN SD-WAN组网 SD-WAN国际专线 海外网络访问 海外网络连接

焱融全闪 F9000X 打造英智创新先进智算平台 训推效能倍增

焱融科技

大模型 智算中心 全闪存储 英智创新 智能算力

Metasploit Pro 4.22.7-2024120601 (Linux, Windows) - 专业渗透测试框架

sysin

Metasploit

四个强大的 Salesforce 开源替代方案(附成本对比)

NocoBase

开源 低代码 CRM 无代码 Salesforce

帮助用户与 AI 实时练习口语,Speak 为何能估值 10 亿美元?丨Voice Agent 学习笔记

RTE开发者社区

如何以MLOps保障时效表达稳定性|得物技术

得物技术

算法 供应链

微信公众号设置关键词回复、自动回复、关注回复、卡密回复平台使用手册

木偶

微信 Web 卡密

鸿蒙NEXT开发案例:九宫格随机

zhongcx

一座重庆工厂,智能与制造的“两江之约”

脑极体

AI

奇奇怪怪的编程语言:Malbolge

不在线第一只蜗牛

编程语言

flstudio2024中文免费版下载安装教程,FL Studio激活码补丁注册码永久免费使用

阿拉灯神丁

编曲软件 FL Studio 激活码生成器 FL Studio2024

阿里p8面试官狂推的java面试神器!jvm与多线程面试80问!

程序员高级码农

Java 程序员 JVM 多线程 java面试

天润融通:为国内外行业巨头提供定制化IT Service解决方案

天润融通

小团队高ROI,中国团队自研 AI 图像生成大模型迈入全球第一梯队_AI&大模型_罗燕珊_InfoQ精选文章