写点什么

xLLM 社区重磅首秀,揭秘大模型推理全景图与开源 AI Infra 生态

  • 2025-11-26
    北京
  • 本文字数:1180 字

    阅读完需:约 4 分钟

大小:699.72K时长:03:58
xLLM社区重磅首秀,揭秘大模型推理全景图与开源AI Infra生态

成立三个月的 xLLM 社区,计划于 12 月 6 日在北京氪空间(学院 8 号)创新中心举办以“共建开源 AI Infra 生态”为主题的线下 Meetup。本次活动将首次对外介绍 xLLM 社区,并系统分享其在技术愿景、核心规划、阶段进展以及社区生态方面的实践与思考,希望为业界提供大模型推理引擎的一种可行路径。

xLLM:超越单一场景的下一代推理引擎框架


过去,AI Infra 基础设施的核心技术长期依赖国外开源框架(如 vLLM、SGLang、TensorRT-LLM 等)。随着 xLLM 等推理引擎的开源,将大大加速国产全栈 AI Infra 生态建设。


区别于当前行业广泛采用的 vLLM(主要聚焦大语言模型与多模态场景),xLLM 定位为更强大的推理引擎框架。其设计之初便着眼于支持多元化、复杂化的生成式 AI 场景,核心能力覆盖:大语言模型 (LLM)、多模态理解与生成、生成式推荐系统、文生图 (Text-to-Image)和文生视频(Text-to-Video)等前沿领域。本次 Meetup 将首次系统阐述 xLLM 如何通过其创新架构,为这些丰富场景提供统一、高效、可扩展的推理支持,以及未来的技术演进规划。据悉,该成果已应用于 11.11 京东大促等核心零售业务场景,助力业务效率提升 5 倍以上,机器成本降低 90% ,有力保障了关键业务在洪峰流量下的平稳流畅运行。

开放生态:模型与硬件的交响曲


此次活动将首次全景式展示 xLLM 框架背后的核心技术。目前,xLLM 框架集成了业界领先的开源 KV Cache 存储解决方案——Mooncake。本次 meetup 上,清华大学副教授,Mooncake 发起人章明星将揭秘 Mooncake 如何为大规模、低延迟的推理任务提供关键的存储加速。


此外,还特别邀请到北京智源人工智能研究院研发经理门春雷,分享在计算单元与算子优化、特别是编译优化方面的前沿经验,探讨如何榨干硬件潜力,实现推理速度的飞跃。


成立之初,xLLM 秉持开放理念,致力于构建繁荣生态。在模型层, xLLM 推理框架具备强大的模型接入能力,可灵活对接多种主流大模型。目前,xLLM 已在 GitHub 等平台开源,全球开发者都可以下载使用。


硬件层方面,xLLM 框架设计兼顾通用性与适配性,为未来更广泛的硬件支持奠定基础。本次 Meetup 将重点介绍与国产算力领跑者昇腾在统一内存池化方案上的应用实践,展示其在高性能、低成本推理上的潜力。未来,还会和清华、北大、中科大、北航、硬件厂商等产学研生态伙伴一起,推动 AI 技术生态的协同创新和行业智能化升级。

诚邀参与,共绘全景


xLLM 社区是一个专注于打造下一代高性能、通用化大模型推理引擎的开源技术社区。成立三个月以来,汇聚了众多来自顶尖科技公司与研究机构的开发者与专家,致力于突破大模型落地应用在性能、成本、场景多样性上的瓶颈,推动 AI 技术的普惠化发展。


此次 Meetup,是一次技术实力的集中展示,更是一张面向未来的“大模型推理全景图”的绘制起点。我们诚挚邀请关注大模型技术发展、AI 基础设施、高性能计算、推荐系统以及国产化 AI 解决方案的开发者、研究者、企业技术决策者与行业伙伴莅临现场,共同探讨交流。

 


2025-11-26 16:023770

评论

发布
暂无评论

温湿度计设备通过阿里云IoT物联网套件上报数据到钉钉群机器人实践——数据价值类

阿里云AIoT

JavaScript Serverless 物联网 机器人 机器学习/深度学习

GuavaCache与物模型大对象引起的内存暴涨分析——设备管理运维类

阿里云AIoT

缓存 算法 监控 物联网 数据格式

实战|网站监控如何做好监测点管理与内网数据采集

云智慧AIOps社区

安全 监控 监控宝 云智慧 网站监控

专场直播预约 | KaiwuDB 离散制造业场景解决方案

KaiwuDB

数据库 KaiwuDB 离线制造业 行业解决发展

什么是安全文件传输

镭速

pytest学习和使用1-pytest安装和版本查看

Python 自动化测试 pytest

武汉等保测评有限公司有哪几家?具体位于哪里?

行云管家

等保 等保测评 等保2.0 武汉

基于 Apache Flink 的实时计算数据流业务引擎在京东零售的实践和落地

Apache Flink

大数据 flink 实时计算

共享订阅--MQTT 5.0新特性

EMQ映云科技

物联网 IoT mqtt 企业号 3 月 PK 榜 共享订阅

大资管行业数字化转型解决方案 | 行业方案

袋鼠云数栈

大数据 数字化转型 解决方案

国家高新技术企业是国企吗?获得高新企业证书有什么用?

行云管家

高新企业 高新技术

NFTScan 与 UniPass 达成合作伙伴,双方在多链 NFT 数据方面展开合作!

NFT Research

NFT

阿里云AIoT物联网平台如何实现设备全球就近接入——设备接入类

阿里云AIoT

运维 监控 物联网 中间件 数据采集

全能代码编辑器:CodeRunner 最新激活版

真大的脸盆

Mac 代码编辑器 Mac 软件 代码编辑 编辑代码

技术详解 阿里云AIoT物模型支撑设备规模已超亿级——设备管理运维类

阿里云AIoT

运维 安全 监控 物联网 芯片

有效载荷标识与内容类型--MQTT 5.0新特性

EMQ映云科技

物联网 IoT mqtt 企业号 3 月 PK 榜 有效载荷标识

基于声网 Flutter SDK 实现互动直播

RTE开发者社区

flutter

Tapdata Connector 实用指南:云原生数仓场景之数据实时同步到 Databend

tapdata

数据库 大数据

8年Java架构师面试官教你正确的面试姿势,10W字面试题搞定春招!

小小怪下士

Java 程序员 后端 java面试

1个案例读懂——游戏产品如何用A/B测试做增长

字节跳动数据平台

云服务 AB testing实战 A/B测试 企业号 3 月 PK 榜

火山引擎DataLeap:数据秒级生产,揭秘电商实时数仓最佳实践!

字节跳动数据平台

数据治理 电商 数据研发 企业号 3 月 PK 榜

【3.10-3.17】写作社区优秀技术博文一览

InfoQ写作社区官方

热门活动 优质创作周报

Matlab常用图像处理命令108例(八)

timerring

图像处理

【分布式技术专题】「分布式技术架构」一文带你厘清分布式事务协议及分布式一致性协议的算法原理和核心流程机制(Paxos篇)

码界西柚

分布式 PAXOS paxos协议 算法分析

物联网数据应用开发最佳实践——数据价值类

阿里云AIoT

数据挖掘 物联网 存储 数据管理 调度

pytest学习和使用2-初步使用和用例运行

Python 自动化测试 pytest

阿里120W年薪架构师力荐750页微服务架构深度解析笔记

程序知音

Java 微服务 编程语言 后端技术

浅谈DWS函数出参方式

华为云开发者联盟

数据库 后端 华为云 华为云开发者联盟 企业号 3 月 PK 榜

xLLM社区重磅首秀,揭秘大模型推理全景图与开源AI Infra生态_AI&大模型_xLLM社区_InfoQ精选文章