写点什么

英特尔高宇:AI 工作负载有多种形态和规模,硬件上没有一刀切的解决方案

  • 2023-12-11
    北京
  • 本文字数:1761 字

    阅读完需:约 6 分钟

大小:941.46K时长:05:21
英特尔高宇:AI工作负载有多种形态和规模,硬件上没有一刀切的解决方案

去年年底以来,随着 ChatGPT 应用体验界面的推出,使得以大模型为主的生成式 AI 技术取得了重大的并且快速地发展,大模型也展现出了令人惊叹的智能涌现能力,表现出了更为强大的创造性和通用场景的普通适用性,技术得以快速发展。


首先取得重大突破的是公共通用大模型,从人类社会大量存积下来的公共数据当中去学习,进而生成高质量的文本、图像、声音甚至是视频等内容,为各个领域的智能创新和每一个人的智能体验创新提供了巨大的想象空间。


然而,出于数据的安全和隐私保护的考虑,以及更高效率,更低成本来享用大模型通用能力的角度考虑,人们又既希望获得公共大模型目前的各类强大的通用服务,同时又希望 AI 能够真正理解自己,提供专属的个性化服务,还要能够充分地保障个人的数据和隐私安全,为此,公共大模型和面向个人的专有大模型混合部署,正逐渐成为产业的一个共识。


在这样的时代背景下,作为消费和商用个体用户中最坚挺的终端,PC 在 AIGC 时代承载了怎样的使命?


12 月 7 日,首届 AI PC 产业创新论坛在北京联想总部举行。此次论坛汇聚了众多用户、终端厂商、算力厂商(芯片)、AI 技术厂商(大模型)、应用领域生态合作伙伴,深度探讨 AI PC 为 AI 普惠带来的巨大改变。此外,在此次论坛上,业内首份《AI PC 产业(中国)白皮书》重磅发布。


与会嘉宾认为,AI PC 到来之际,大模型将成为每一个人必不可少的助手,同时对推理的算力需求将超过训练的算力需求。算力集中于云端的模式变得不可持续,AI 计算负载将逐渐由云端向边缘侧和端侧下沉。在搭建本地智能算力上,CPU+NPU+GPU 异构式架构方案是目前最为成熟的方案之一。


对此,英特尔中国区技术总经理高宇表示,AI 工作负载有多种形态和规模。所以,从硬件上没有一刀切的解决方案。“基于多年的学习与市场经验,我们提出了 XPU 的概念,包括 GPU/NPU/CPU。”他说,联想是英特尔的战略合作伙伴,双方已经基于即将发布的 Meteor Lake 处理器推进 AI 体验的开发和创新。


作为算力厂商的代表,英特尔正采取三项措施,来持续构筑端侧的算力。一是构建为 AI 而设计的高效能 AI-Ready 平台;二是提供工具以支持广泛的 x86 应用生态系统,三是激发创新,开启全新的 AI 体验,包括为软件和应用开发人员提供支持,以便在各个领域里都能更好将 AI 功能完美部署到 PC 客户端上。


英特尔今年还正式启动了首个“AI PC 加速计划”,将在 2025 年前为超过 1 亿台 PC 带来人工智能特性。其中,通过与超过 100 家 ISV 合作伙伴深度合作,并集合 300 余项 AI 加速功能,英特尔将在音频效果、内容创建、游戏、安全、直播、视频协作等方面继续强化 PC 的体验。


据了解,在实践中,英特尔 13 代酷睿处理器已经可以流畅运行 70 亿到 180 亿参数的大模型,并成功部署了 LLM。高宇表示,即将推出代号 Meteor Lake 的 AI PC 处理器,代表英特尔 40 年来最重大的架构转变,旨在为 AI PC 时代铺平道路。它是首个内置 AI 加速引擎 NPU 的处理器,可在 PC 上实现高能效的 AI 加速和本地推理。


为了完成用户相对复杂的任务,AI PC 往往需要调动不同的模型和应用,为 AI PC 的能力进行补充和延伸。因此,AI PC 功能的发挥不仅需要像英特尔这样的算力厂商的参与,还需要整个开放的行业生态作为支撑。


在 AI PC 的推动下,PC 产业生态将从应用为本转向以人为本,用户成为行业生态创新的驱动者和创造者。模型、应用、算力厂商都需要围绕 AI PC(终端)形态下新的以人为本的需求做出改变,在研发工作中对 AI 的高效运行予以充分的考量,以适应 AI PC 新时代。


联想作为终端厂商,是离用户最近的一端,因而被推到台前,成为生态组织者和生态的核心中枢。以场景需求为基础面向用户整合产业资源,承担 AI PC 技术整合创新交付者、新一代个人智能体及 AI 入口创造者和用户体验维护者、本地化个人数据及隐私安全守护者和开放的 AI 应用生态标准制定者和推广者身份,职责重大。正是出于行业责任,联想联合国际数据公司 IDC 发布业内首份《AI PC 产业(中国)白皮书》,对 AI PC 进行了全新定义,以加速构建 AI PC 产业新生态。


高宇最后表示,AI PC 加速计划由即将发布的 IntelCore Ultra 处理器率先驱动。未来,英特尔将搭建性能并行和吞吐量适用于融合 AI 的媒体/3D/渲染的 GPU,打造适用于持续的 AI 和分担 AI 负载的专用低功耗 AI 引擎 NPU;迭代能够快速响应,适用于轻量级、单次推理的低延迟任务的 CPU,相信在新平台的加持下,英特尔将加快与联想共同打造混合 AI 算力架构,驱动 AI PC 落地。

2023-12-11 19:514152

评论

发布
暂无评论
发现更多内容

架构实战4-千万学生试卷存储方案

架构实战营 「架构实战营」

个税通识

清风明月

电商秒杀系统架构设计

小虎

架构训练营

Databend 内幕大揭秘第一弹 - minibend 简介

Databend

rust

软件测试/测试开发 | 使用postman发送请求

测试人

软件测试 Postman 自动化测试 接口测试 测试开发

模块四作业

程序员小张

「架构实战营」

在别墅大宅中打造全屋智能,总共需要几步?

脑极体

全屋智能

什么样的故障让阿里云换了总裁?

慕枫技术笔记

云计算 后端

EMQ受邀出席华为云Top SaaS领航者私享会,共话SaaS企业发展未来

EMQ映云科技

物联网 IoT 华为云 emq 企业号 1 月 PK 榜

用 Pipy 做个 HTTP 隧道

Flomesh

HTTP Pipy 流量管理

跳跃表数据结构与算法分析

京东科技开发者

redis 算法 跳跃表; 数据结构算法 企业号 1 月 PK 榜

2023-01-15:销售员。编写一个SQL查询,报告没有任何与名为 “RED” 的公司相关的订单的所有销售人员的姓名。以 任意顺序 返回结果表。 DROP TABLE IF EXISTS `com

福大大架构师每日一题

数据库 sql 福大大

Apache Flink 社区 2022 年度报告:Evolution, Diversity, Connection

Apache Flink

大数据 flink 实时计算

秒杀系统架构设计

Johnny

「架构实战营」

诠释现代美学设计,TECNO首款笔记本电脑MEGABOOK T1重磅来袭!

极客天地

百度安全入选权威报告《联邦学习与可信AI市场机会分析》典型厂商

百度安全

不会数学的程序员,只能走到初级开发工程师!

小傅哥

Java 数据结构 算法 数学 小傅哥

log4j 默认配置文件

JefferLiu

重磅发布 | 博睿数据发布金融行业精选客户案例集

博睿数据

可观测性 智能运维 博睿数据 精选案例

华为云代码检查服务CodeArts Check深度解读——代码缺陷早发现,全面守护软件质量和安全

科技热闻

易观千帆 | 11月用户体验GX评测:银行APP用户体验稳定提升,从流量竞争逐渐转向用户体验竞争

易观分析

用户体验 手机银行

极客时间架构训练营模块四作业

现在不学习马上变垃圾

架构训练营10期

关于Linux内存回收的几个问题

SkyFire

内存 Linux Kenel

「Go框架」抽丝剥茧:探究iris路由的底层存储结构

Go学堂

golang 开源 程序员 个人成长

如何理解高性能服务器的高性能、高并发?

GPU算力

线程 线程池 协程

震网(Stuxnet)病毒深度解析:首个攻击真实世界基础设施的病毒

华为云开发者联盟

安全 后端 华为云 企业号 1 月 PK 榜 震网

架构实战营-电商秒杀系统设计

Geek_b35d92

架构 秒杀 电商

认识区块链,认知区块链——Web3

MavenTalker

区块链 web3

数据库故障致美国超一万航班取消或延迟

NineData

数据库 运维 数据库开发 数据备份 数据系统

【避坑指南】快准狠!一键采购电子元器件

华秋PCB

工具 元器件 PCB PCB设计

软件测试/测试开发 | 使用 cURL 发送请求

测试人

软件测试 自动化测试 curl 测试开发

英特尔高宇:AI工作负载有多种形态和规模,硬件上没有一刀切的解决方案_生成式 AI_李冬梅_InfoQ精选文章