2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

xLLM 社区重磅首秀,揭秘大模型推理全景图与开源 AI Infra 生态

  • 2025-11-26
    北京
  • 本文字数:1180 字

    阅读完需:约 4 分钟

大小:699.72K时长:03:58
xLLM社区重磅首秀,揭秘大模型推理全景图与开源AI Infra生态

成立三个月的 xLLM 社区,计划于 12 月 6 日在北京氪空间(学院 8 号)创新中心举办以“共建开源 AI Infra 生态”为主题的线下 Meetup。本次活动将首次对外介绍 xLLM 社区,并系统分享其在技术愿景、核心规划、阶段进展以及社区生态方面的实践与思考,希望为业界提供大模型推理引擎的一种可行路径。

xLLM:超越单一场景的下一代推理引擎框架


过去,AI Infra 基础设施的核心技术长期依赖国外开源框架(如 vLLM、SGLang、TensorRT-LLM 等)。随着 xLLM 等推理引擎的开源,将大大加速国产全栈 AI Infra 生态建设。


区别于当前行业广泛采用的 vLLM(主要聚焦大语言模型与多模态场景),xLLM 定位为更强大的推理引擎框架。其设计之初便着眼于支持多元化、复杂化的生成式 AI 场景,核心能力覆盖:大语言模型 (LLM)、多模态理解与生成、生成式推荐系统、文生图 (Text-to-Image)和文生视频(Text-to-Video)等前沿领域。本次 Meetup 将首次系统阐述 xLLM 如何通过其创新架构,为这些丰富场景提供统一、高效、可扩展的推理支持,以及未来的技术演进规划。据悉,该成果已应用于 11.11 京东大促等核心零售业务场景,助力业务效率提升 5 倍以上,机器成本降低 90% ,有力保障了关键业务在洪峰流量下的平稳流畅运行。

开放生态:模型与硬件的交响曲


此次活动将首次全景式展示 xLLM 框架背后的核心技术。目前,xLLM 框架集成了业界领先的开源 KV Cache 存储解决方案——Mooncake。本次 meetup 上,清华大学副教授,Mooncake 发起人章明星将揭秘 Mooncake 如何为大规模、低延迟的推理任务提供关键的存储加速。


此外,还特别邀请到北京智源人工智能研究院研发经理门春雷,分享在计算单元与算子优化、特别是编译优化方面的前沿经验,探讨如何榨干硬件潜力,实现推理速度的飞跃。


成立之初,xLLM 秉持开放理念,致力于构建繁荣生态。在模型层, xLLM 推理框架具备强大的模型接入能力,可灵活对接多种主流大模型。目前,xLLM 已在 GitHub 等平台开源,全球开发者都可以下载使用。


硬件层方面,xLLM 框架设计兼顾通用性与适配性,为未来更广泛的硬件支持奠定基础。本次 Meetup 将重点介绍与国产算力领跑者昇腾在统一内存池化方案上的应用实践,展示其在高性能、低成本推理上的潜力。未来,还会和清华、北大、中科大、北航、硬件厂商等产学研生态伙伴一起,推动 AI 技术生态的协同创新和行业智能化升级。

诚邀参与,共绘全景


xLLM 社区是一个专注于打造下一代高性能、通用化大模型推理引擎的开源技术社区。成立三个月以来,汇聚了众多来自顶尖科技公司与研究机构的开发者与专家,致力于突破大模型落地应用在性能、成本、场景多样性上的瓶颈,推动 AI 技术的普惠化发展。


此次 Meetup,是一次技术实力的集中展示,更是一张面向未来的“大模型推理全景图”的绘制起点。我们诚挚邀请关注大模型技术发展、AI 基础设施、高性能计算、推荐系统以及国产化 AI 解决方案的开发者、研究者、企业技术决策者与行业伙伴莅临现场,共同探讨交流。

 


2025-11-26 16:0213

评论

发布
暂无评论

AppLink上的小鹅通能实现什么操作呢?

谷云科技RestCloud

APPlink

交易所开发:加密货币交易平台开发的见解

区块链软件开发推广运营

交易所开发 dapp开发 区块链开发 链游开发 公链开发

情感语音识别技术的挑战与未来发展

数据堂

使用CURL获取速卖通详情的API接口

Noah

Java中tranisent关键字到底是干嘛用的?

郑在暴富中

Java 关键字 transient

Linux 爱好者线下沙龙:成都场圆满结束 & 下一场西子湖畔相见 | LLUG·第五站

OpenAnolis小助手

操作系统 杭州 龙蜥社区 LLUG Linux中国

弹性云主机支持多种规格

天翼云开发者社区

云计算 云主机 云平台

MatrixOne完成与欧拉、麒麟信安的兼容互认

MatrixOrigin

分布式数据库 云原生数据库 MatrixOrigin MatrixOne HTAP数据库

有限元分析初学者需要关注哪些问题?

思茂信息

仿真软件 仿真技术 有限元分析 有限元仿真 有限元技术

情感语音识别技术的发展趋势与前景

数据堂

代码迭代:软件开发者在众包平台的发展之路

知者如C

MatrixOne 实战系列回顾 | 建模与多租户

MatrixOrigin

分布式数据库 云原生数据库 MatrixOrigin MatrixOne HTAP数据库

AI机器学习实战:构建智能系统的关键步骤

不在线第一只蜗牛

人工智能 机器学习 AI

小程序转换工具—Antmove 使用教学

FN0

小程序 Antmove

SaaS与PaaS平台的区别

树上有只程序猿

低代码 PaaS SaaS

MATIC WORLD智能合约DAPP质押项目系统开发

l8l259l3365

亲身体验云原生顶会北美 KubeCon,5个要点和4个 Fun Facts

小猿姐

Kubernetes 云原生 cncf KubeCON

云电脑运行原理分析

天翼云开发者社区

虚拟化 云平台 云电脑

三策略,六步骤,Jenkins 迁移到极狐GitLab CI 的终极指南

极狐GitLab

ci DevOps gitlab 持续集成 jenkins

MatrixOne 支持多样化生态工具,持续提升开发者体验

MatrixOrigin

分布式数据库 云原生数据库 MatrixOrigin MatrixOne HTAP数据库

情感语音识别的研究方法与实践

数据堂

item_get_pro-获得淘宝商品详情高级版api接口

技术冰糖葫芦

API 文档

xLLM社区重磅首秀,揭秘大模型推理全景图与开源AI Infra生态_AI&大模型_xLLM社区_InfoQ精选文章