写点什么

基于昇腾 NPU 的生成式推荐 scaling law 落地实践 |AICon 北京

  • 2025-12-17
    北京
  • 本文字数:965 字

    阅读完需:约 3 分钟

大小:540.78K时长:03:04
基于昇腾NPU的生成式推荐scaling law落地实践 |AICon 北京

12 月 19-20 日, AICon全球人工智能开发与应用大会收官之站将在北京举办,本次大会 将以 “探索 AI 应用边界” 为主题,聚焦企业级 Agent 落地、上下文工程、AI 产品创新等多个热门方向,围绕企业如何通过大模型提升研发与业务运营效率的实际应用案例,邀请来自阿里、字节、华为、京东、快手、美团等头部企业、大厂以及明星创业公司的专家,带来一线的大模型实践经验和前沿洞察。一起探索 AI 应用的更多可能,发掘 AI 驱动业务增长的新路径!


华为主任工程师郭威已确认出席并将在「大模型时代下的搜广推系统实践」专题发表题为《基于昇腾NPU的生成式推荐scaling law落地实践》的主题分享。随着 Meta 在 2024 年发布基于 HSTU 架构的 GR 范式,生成式推荐系统正逐步得到越来越多的关注。许多公司纷纷跟进,字节,美团,快手,百度等公司在此方向上均取得了显著进展。本次演讲将介绍我们基于昇腾 NPU 针对生成式推荐的探索,包括推荐系统 Performance Law 的研究,生成式排序系统以及昇腾亲和的网络架构等技术。


郭威,华为诺亚方舟实验室主任工程师,研究方向为用户行为建模和生成式推荐系统。在 KDD,SIGIR,WWW 等高水平会议和期刊上发表论文 20 多篇。多项研究工作落地华为应用市场、广告等真实业务场景。相关工作谷歌学术引用 2000 余次,曾获 DLP-KDD best paper, KDD best student paper 等奖项。他在本次会议的详细演讲内容如下:

演讲提纲

  1. 关于生成式推荐

  • 生成式推荐定义

  • 生成式推荐发展趋势洞察

2. 生成式推荐进展介绍

  • 高质量数据生成

  • 生成式推荐大模型架构

  • 生成式推荐学习策略

3. 生成式推荐昇腾实践

  • 昇腾亲和的算法演进

  • 昇腾亲和的系统演进

4. 总结和展望

  • 总结

  • 下一步计划

您认为,这样的技术在实践过程中有哪些痛点?生成式推荐系统如何有效 scaling,训推系统如何优化以满足模型实时性和线上严格时延要求。

听众收益

  • 基于昇腾 npu 的生成式推荐实践经验

  • 生成式推荐的洞察和未来展望


除此之外,本次大会还策划了LLM 时代的软件研发新范式Context EngineeringData+AI / Agent 落地实践大模型系统工程企业级 Agent 的设计与落地大模型时代下的搜广推系统实践多模态从技术突破到创新应用落地等 10 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 50+资深专家在 AICon 北京站现场带来前沿技术洞察和一线实践经验。


年度收官之战,目前日程 100%上线,详情可扫码或联系票务经理 13269078023 咨询。


2025-12-17 14:1354

评论

发布
暂无评论

不同操作系统之间的应用是否可以兼容?

InfoQ IT百科

DevSecOps软件安全开发实践

华为云开发者联盟

开源 DevSecOps 安全开发 华为云DevCloud 软件研发

http server源码解析

爱好编程进阶

Java 面试 后端开发

如何调节鼠标的灵敏度?

InfoQ IT百科

【网络安全】8个网络安全名词解释看这里!

行云管家

网络安全 防火墙 数据安全 堡垒机

【等保】二级等保常见问题解答汇总

行云管家

网络安全 等保 等保2.0 二级等保

“迈向元宇宙的一小步”鲁班会开发者深度论坛落地北京

华为云开发者联盟

音视频 opengauss 华为云 元宇宙 鲁班会

Kubernetes 中数据包的生命周期 -- 第 2 部分

Se7en

Dubbo如何处理业务异常,这个一定要知道哦!

爱好编程进阶

Java 面试 后端开发

Flink SQL Client综合实战

爱好编程进阶

Java 面试 后端开发

git(1) 起步

爱好编程进阶

Java 面试 后端开发

java 使用Html2Image将html转图片

爱好编程进阶

Java 面试 后端开发

怎么样判断显卡性能好坏?

InfoQ IT百科

跟我读CVPR 2022论文:基于场景文字知识挖掘的细粒度图像识别算法

华为云开发者联盟

图像识别 推理 视觉 文字检测 语义信息

Java中return和finally到底哪个先执行

爱好编程进阶

Java 面试 后端开发

java程序员的AI之路-大数据篇 hadoop安装

爱好编程进阶

Java 面试 后端开发

聊一聊龙蜥硬件兼容性 SIG 那些事儿 | 龙蜥 SIG

OpenAnolis小助手

开源 sig 硬件兼容 龙蜥操作系统

一文深入Java浅拷贝和深拷贝

芝士味的椒盐

Java 大数据 Java 开发 深拷贝 浅拷贝

与操作系统性能最相关的组件是什么?

InfoQ IT百科

电脑硬件中光驱的作用是什么?

InfoQ IT百科

Java 集合容器篇面试题(上)-王者笔记

爱好编程进阶

Java 面试 后端开发

电脑分区C盘格式化会怎样?

InfoQ IT百科

Java中使用Spring-security(一)

爱好编程进阶

Java 面试 后端开发

复杂度守恒定律与计算哲学|Authing CEO 谢扬

Authing

开发者 云原生 身份云 生产力 Idaas

Google 出品的 Java 编码规范,权威又科学,强烈推荐

爱好编程进阶

Java 面试 后端开发

一文看懂“低代码,零代码,APAAS”是什么?怎么选?

优秀

低代码 零代码 aPaaS

Java并发关键字-volatile

爱好编程进阶

Java 面试 后端开发

Elasticsearch 中为什么选择倒排索引而不选择 B 树索引

爱好编程进阶

Java 面试 后端开发

如何实现迭代快速排序算法(iterative quicksort algorithm)?

InfoQ IT百科

前端食堂技术周刊第 34 期:Node.js v18 、Nuxt 3 RC1、Parcel v2.5.0、计算机程序的构造和解释、Linux 命令行世界生存指南

童欧巴

JavaScript 前端 技术周刊

纯 JS 实现 WebRTC 视频通话

杨成功

音视频 WebRTC

基于昇腾NPU的生成式推荐scaling law落地实践 |AICon 北京_AI&大模型_AICon 全球人工智能开发与应用大会_InfoQ精选文章