英特尔数据中心与人工智能事业部 AI 软件架构师何普江确认出席 QCon 上海，分享大模型时代：最大化 CPU 价值的优化策略_生成式 AI_徐晓博_InfoQ精选文章



 写点什么

登录/注册



大小：660.17K时长：03:45

英特尔数据中心与人工智能事业部 AI 软件架构师何普江确认出席 QCon 上海，分享大模型时代：最大化 CPU 价值的优化策略

QCon 全球软件开发大会，将于 12 月在上海召开。英特尔数据中心与人工智能事业部 AI 软件架构师何普江将发表题为《大模型时代：最大化 CPU 价值的优化策略》主题分享，探讨一种结合 CPU 和 GPU 的投机采样方法，在大语言模型时代充分利用 CPU 资源的关键策略，以及最新的性能情况，以便了解这些优化策略的实际效果。

何普江，2007 年硕士毕业于中国科学技术大学。精通英特尔软件架构、英特尔产品与技术以及 IA 平台性能优化。在英特尔工作期间，为国内主流 ISV 开发出基于 IA 平台的云计算产品过程中提供关键支持，并优化了多家主要互联网公司的核心产品，使其性能提升数倍。对 PyTorch，Tensorflow 等 AI 框架有深入研究，并拥有 10 年以上软件优化经验。工作期间曾获得英特尔中国个人员工最高荣誉奖，与国内互联网厂商多个部门进行深度合作，并在 2019 年助力某云厂商云在 MLPerf 评测中创下了业界领先的 Performance/TOPS 性能记录。他致力于基于 IA 架构平台的深度学习、机器学习研究和在互联网行业的落地推广工作，最新工作包括创建并开源了 CPU 上大语言模型的极致优化方案 xFasterTransformer。他在本次会议的演讲内容如下：

演讲：大模型时代：最大化 CPU 价值的优化策略

本次演讲将探讨在大语言模型时代充分利用 CPU 资源的关键策略。具体介绍一些结合硬件特性的优化方法，例如利用 CPU 的多核特性、采用并行计算和 AMX 指令集扩展技术来提高处理速度。

此外还将介绍一种结合 CPU 和 GPU 的投机采样方法，通过在 CPU 上运行部分计算任务，充分利用 CPU 资源并减少对 GPU 的依赖。最后，我将分享一些最新的性能情况，让您了解这些优化策略的实际效果。通过这些方法，您将能够更好地利用 CPU 资源，提高模型推理速度，以更快速高效的实现生成式模型部署落地。

演讲提纲：

大语言模型时代为什么需要最大化 CPU 价值
CPU 上的大模型优化策略

○ 大语言模型计算特点

○ CPU 硬件特性概览

○ 优化方法

○ 从向量化到张量化

○ 从并行执行到分布式推理

○ 低精度优化

○ 深入 CPU 微架构的软件优化

○ 各优化策略的实际性能数据对比及效果展示

结合 CPU 和 GPU 的投机采样方法

○ CPU 和 GPU 协同工作的背景

○ 投机采样技术的介绍

○ 利用 CPU 进行部分计算任务的优势

○ 优化方法：选择合适的投机采样策略、任务调度等

总结与展望

○ 各优化方法的核心优势与局限性总结

○ 对未来大语言模型时代的展望与挑战

听众收益点：

○ 理解并结合硬件特性进行优化，提高模型推理速度和处理能力

○ 了解 CPU 上的最新性能情况，为实际业务的大模型线上部署提供更多选择

○ 掌握结合 CPU 和 GPU 协同工作的优化策略，减少对 GPU 的依赖，提高资源利用率

除上述演讲外，QCon 上海还将围绕 GenAI和通用大模型应用探索、AI Agent 与行业融合应用的前景、LLM 时代的性能优化、智能化信创软件 IDE、面向人工智能时代的架构、性能工程：提升效率和创新的新方法等专题进行交流。

QCon 上海 2023，相约 12 月！9 折优惠仅剩最后 4 天，现在购票立减￥680！咨询购票请联系：18514549229（微信同手机号）。

评论

发布

暂无评论

谷歌：使用-Android-Studio-Profiler-工具解析应用的内存和-CPU-使用数据

android 程序员移动开发

资深架构师和你谈谈 Kotlin 的泛型

android 程序员移动开发

裸辞两个月从Android转战web前端的求职之路

android 程序员移动开发

解决Fragment多层嵌套时onActivityResult无法正确回调的问题

android 程序员移动开发

计算机编码简析

android 程序员移动开发

Linux基金会宣布成立NextArch Foundation基金会第四范式成为首批共建单位

第四范式开发者社区

详解-RxJava2-的线程切换原理(1)

android 程序员移动开发

设计模式(行为型)之模板方法模式(Template Method Pattern)

android 程序员移动开发

详解BAT面试必问之ThreadLocal（源码+内存）

android 程序员移动开发

谷歌-在-CI-中使用-Benchmark-进行回归分析

android 程序员移动开发

自定义View

android 程序员移动开发

自定义ViewGroup实现微信朋友圈九宫格图片控件

android 程序员移动开发

模块三作业

「架构实战营」

认识ClassLoader

android 程序员移动开发

记一次腾讯社招Android面试（已拿到offer入职）

android 程序员移动开发

蒂花之秀---大神用漫画讲解字符串匹配算法，让你噩梦变美梦

android 程序员移动开发

要想工资涨得快，还是得跳槽？一个三本Android程序猿外包到阿里的逆袭之路

android 程序员移动开发

论一个APP从启动到主页面显示经历的过程？

android 程序员移动开发

设计模式学习--观察者模式(Observer Pattern)

android 程序员移动开发

详解HTTP协议

android 程序员移动开发

nginx 缓存大小的含义

设计模式之行为型模式

android 程序员移动开发

详解-RxJava2-的线程切换原理

android 程序员移动开发

记联想公司的一次Android面试

android 程序员移动开发

Java-第一周的第3题

自定义View（一） Android 可计数EditText实现

android 程序员移动开发

致刚入行的小白，或者工作一到三年的Android程序员，如何规避“内卷

android 程序员移动开发

详解Gradle自动实现Android组件化

android 程序员移动开发

计算机编码简析(1)

android 程序员移动开发

试用期没通过的原因，居然是被发现了上班偷偷干这事

android 程序员移动开发

详解二叉搜索树(BST)的Java实现和五种遍历方式

android 程序员移动开发