2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

xLLM 社区重磅首秀,揭秘大模型推理全景图与开源 AI Infra 生态

  • 2025-11-26
    北京
  • 本文字数:1180 字

    阅读完需:约 4 分钟

大小:699.72K时长:03:58
xLLM社区重磅首秀,揭秘大模型推理全景图与开源AI Infra生态

成立三个月的 xLLM 社区,计划于 12 月 6 日在北京氪空间(学院 8 号)创新中心举办以“共建开源 AI Infra 生态”为主题的线下 Meetup。本次活动将首次对外介绍 xLLM 社区,并系统分享其在技术愿景、核心规划、阶段进展以及社区生态方面的实践与思考,希望为业界提供大模型推理引擎的一种可行路径。

xLLM:超越单一场景的下一代推理引擎框架


过去,AI Infra 基础设施的核心技术长期依赖国外开源框架(如 vLLM、SGLang、TensorRT-LLM 等)。随着 xLLM 等推理引擎的开源,将大大加速国产全栈 AI Infra 生态建设。


区别于当前行业广泛采用的 vLLM(主要聚焦大语言模型与多模态场景),xLLM 定位为更强大的推理引擎框架。其设计之初便着眼于支持多元化、复杂化的生成式 AI 场景,核心能力覆盖:大语言模型 (LLM)、多模态理解与生成、生成式推荐系统、文生图 (Text-to-Image)和文生视频(Text-to-Video)等前沿领域。本次 Meetup 将首次系统阐述 xLLM 如何通过其创新架构,为这些丰富场景提供统一、高效、可扩展的推理支持,以及未来的技术演进规划。据悉,该成果已应用于 11.11 京东大促等核心零售业务场景,助力业务效率提升 5 倍以上,机器成本降低 90% ,有力保障了关键业务在洪峰流量下的平稳流畅运行。

开放生态:模型与硬件的交响曲


此次活动将首次全景式展示 xLLM 框架背后的核心技术。目前,xLLM 框架集成了业界领先的开源 KV Cache 存储解决方案——Mooncake。本次 meetup 上,清华大学副教授,Mooncake 发起人章明星将揭秘 Mooncake 如何为大规模、低延迟的推理任务提供关键的存储加速。


此外,还特别邀请到北京智源人工智能研究院研发经理门春雷,分享在计算单元与算子优化、特别是编译优化方面的前沿经验,探讨如何榨干硬件潜力,实现推理速度的飞跃。


成立之初,xLLM 秉持开放理念,致力于构建繁荣生态。在模型层, xLLM 推理框架具备强大的模型接入能力,可灵活对接多种主流大模型。目前,xLLM 已在 GitHub 等平台开源,全球开发者都可以下载使用。


硬件层方面,xLLM 框架设计兼顾通用性与适配性,为未来更广泛的硬件支持奠定基础。本次 Meetup 将重点介绍与国产算力领跑者昇腾在统一内存池化方案上的应用实践,展示其在高性能、低成本推理上的潜力。未来,还会和清华、北大、中科大、北航、硬件厂商等产学研生态伙伴一起,推动 AI 技术生态的协同创新和行业智能化升级。

诚邀参与,共绘全景


xLLM 社区是一个专注于打造下一代高性能、通用化大模型推理引擎的开源技术社区。成立三个月以来,汇聚了众多来自顶尖科技公司与研究机构的开发者与专家,致力于突破大模型落地应用在性能、成本、场景多样性上的瓶颈,推动 AI 技术的普惠化发展。


此次 Meetup,是一次技术实力的集中展示,更是一张面向未来的“大模型推理全景图”的绘制起点。我们诚挚邀请关注大模型技术发展、AI 基础设施、高性能计算、推荐系统以及国产化 AI 解决方案的开发者、研究者、企业技术决策者与行业伙伴莅临现场,共同探讨交流。

 


2025-11-26 16:023960

评论

发布
暂无评论

Dubbo核心技术

苏格拉格拉

分布式 微服务 dubbo RPC 集群

云栖大会开源重磅升级!PolarDB-X v2.2: 企业级和国产化适配

阿里云数据库开源

阿里云 polarDB 云栖大会 PolarDB-X 阿里云数据库

阿里云机器学习平台 PAI宣布集成国产深度学习框架 OneFlow

阿里云大数据AI技术

机器学习 阿里云 oneflow

阿里进入“全面云原生深度用云”阶段 PaaS支出占用云总成本43%

阿里技术

云计算 云原生 云栖大会

产品网站的FAQ页面该如何编辑?

Baklib

产品 FAQ

Redis核心技术

苏格拉格拉

redis 架构 持久化 部署 集群

Oracle表空间设计基本原则

默默的成长

oracle 前端 11月月更

Wallys/QCN9074 WiFi 6E Card OpenWRT, IPQ6010, IPQ6018,802.11ax,industrial m.2 card/QUECTEL RM500Q-GL

wallys-wifi6

IPQ6010 ipq6018 QCN9074

Baklib|如何搭建在线帮助中心站点?

Baklib

介绍:什么是智能合约dapp系统开发一站式服务

W13902449729

RocketMQ核心技术

苏格拉格拉

RocketMQ 消息队列 消息中间件 微服务框架

HTML学习笔记(一)

lxmoe

html 前端 学习笔记 11月月更

游戏链改NFT系统开发Web3技术

薇電13242772558

web3

最新的国内低代码开发平台排名,你知道几个?

优秀

低代码 低代码开发平台 低代码平台

赋能信息技术应用创新,需要怎样的可持续性业务架构?

通明湖

负载均衡

微服务先等等,我去刷个“虚拟背景”的副本

为自己带盐

虚拟背景 11月月更 trtc

网易云信智码超清转码技术实践

网易云信

音视频开发

概述DDoS分类

穿过生命散发芬芳

DDoS 11月月更

并发编程中的锁、条件变量和信号量

C++后台开发

Go 并发编程 linux开发 C++开发

oracle中计算两个日期的相差天数、月数、年数等等

默默的成长

oracle 前端 11月月更

1年Java经验,信心满满出去面试,被问麻了...

Java永远的神

spring 程序员 后端 JVM Java 面试

云科通明湖:金融业务可持续性能力建设,少不了这块“拼图”!

通明湖

负载均衡

智采云火了的背后,是企业降本增效的刚需

ToB行业头条

Redis数据结构

苏格拉格拉

redis 缓存 Redis 数据结构

Docker PHP 入门实践 (三)

Felix

php Docker thinkphp 11月月更

FOTSL:端到端的文本检测与识别方法的原理方法与优势

合合技术团队

人工智能 场景 端口 文本检测 文本识别

uniapp引入 iconfont

源字节1号

微信小程序 软件开发 前端开发 后端开发

Oracle 开发规范(一)

默默的成长

oracle 前端 11月月更

什么是 NFT 蓝筹项目

NFT Research

区块链 NFT

如何通过Java将PDF转为Excel

Geek_249eec

Excel PDF java;

xLLM社区重磅首秀,揭秘大模型推理全景图与开源AI Infra生态_AI&大模型_xLLM社区_InfoQ精选文章