写点什么

金山云升级全栈云计算体系,全方位承接大模型应用

  • 2024-02-01
    北京
  • 本文字数:2469 字

    阅读完需:约 8 分钟

大小:1.25M时长:07:18
金山云升级全栈云计算体系,全方位承接大模型应用

随着云原生、AIGC、大模型等新兴技术的迅速发展,智能化时代开启。云计算也正全面步入 3.0 时代,即云计算和人工智能深度融合的阶段。在这个阶段,人工智能技术成为云计算进一步释放潜力的核心推动力。

 

近日,金山云举办了「云+人工智能·时代新机遇」媒体沟通会,金山云副总裁钱一峰、金山云公有云产品中心负责人孙晓、金山云人工智能与大数据产品中心负责人徐寅斐在会上分享了金山云在基础能力、平台能力和模型服务等方面的技术历程和落地实践。通过技术自研和升级,金山云已初步建成人工智能时代民用领域全栈的云计算体系。

 

夯实基础,全面升级人工智能服务能力

 

全球数字化浪潮风起云涌,云计算作为数字经济重要的支撑基础,正发挥越来越重要的作用。其中,智能化作为云计算 3.0 时代的重要理念,已成为数字基础设施升级的重要驱动力。知名调研机构 IDC 于 2023 年发布的报告显示,未来 5 年,以大模型、生成式人工智能驱动的下一代人工智能有望带动整体云产业穿过下行阶段,重回高增长时代。

 

顺应趋势,金山云深入探索前沿技术,围绕 AIGC 升级核心计算、存储、网络等产品,从多个维度全面拥抱人工智能。

 

金山云副总裁钱一峰强调,在此次技术升级中,在网络上采用了目前业界流行的高性能 RoCE 网络。在成本方面,同样的集群如果采用 IB 网络,网络本身的成本几乎占整个算力群的一半,如果用 RoCE 网络,只占 5%到 10%,所以国内很多大厂都在往 RoCE 网络转,金山也是如此。

 

在计算方面,金山云第七代云服务器 X7 搭载第四代英特尔®至强®可扩展处理器、支持英特尔® AMX 原生加速能力,CPU 性能较上代最高提升 60%,内存升级至 DDR5,频率较上一代性能提升 50%。融合金山云自主创新的加速技术,云服务器 X7 可有效提升模型推理性能。

 

根据数据从极热到极冷的不同热度,金山云对象存储已覆盖标准存储、低频存储、深度低频存储、归档存储、深度冷归档存储和全闪存储等不同访问热度的存储产品。其中,金山云对象存储 KS3 极速型最高可提供 1Tbps/PB 的兑付带宽,相较基于机械硬盘(HDD)的对象存储性能提升了上百倍,能为 AIGC、存算分离和高性能计算等场景提供强有力的存储解决方案。

 

在底层技术基础上,金山云此次升级还新增了金山轻舟智问以及一些合作的商业模型。

 

一直以来,业内有一种观点认为一个大模型就解决所有问题,因为所有人都可以去调用大模型的 API,但根据用户的反馈和场景需求来看,把所有问题都扔给一个大模型去解决是非常昂贵的,更经济的做法是将不同的场景用不同规模的模型去解决。将这些平台打包在一起,可以为客户提供一个综合性价比最高的解决方案。

 

过去这一年,金山云一直在做两件事——夯实基础和做长长板。在云计算方上重点打磨四大基础能力:速度快、性能好、成本低、稳定易用;而做长长板找增量则体现在金山云在混合云、分布式云上的很多创新。

 

具体而言,在在公有云的核心产品上第一要做到一切皆标准,提升用云效率。第二,要做到软硬结合,最大限度提升客户用云性价比。

 

在混合云方面,客户拥有专属区或者专属集群,这既让客户拥有了云下的独立,又能让其享受云上的规模红利和弹性。

 

此外,在 Serverless 化上也有了新进展。Serverless 化过去是局限在算力层面,但随着存算分离场景的流行已经渗透到 PaaS 层面,如今 MySQL 也已经做到了 Serverless 化,另外也引入了开源向量数据库。

 

面向大模型应用场景,金山云推出互信虚拟私有网络(简称“互信 VPC”),解决模型厂商和应用厂商互信的问题。相对于标准 VPC,互信 VPC 对进出 VPC 的通信行为有着更为严格的控制,帮助客户解决合规和互信问题。针对 HTTP、HTTPS 等应用层负载场景,公司推出应用型负载均衡 ALB(Application Load Balancer),单实例最大支持 100 万 QPS。与云原生场景融合,客户在使用金山云容器服务 KCE 产品或自建 K8S 集群时,ALB 都可作为 Ingress 部署,为业务提供网络流量调度服务。

勇立潮头,做大模型助力者

2023 年被称为大模型“元年”。公开数据显示,从年初到年末,国内大模型数量超过 200 个。与“大模型”数量呈倍数级增长相反的是,真正被调用的大模型却相对较少。在本次大模型浪潮中,金山云坚持中立定位,充分发挥自身的底座和平台能力,做大模型的助力者。

 

在洞察到模型供需方的痛点后,金山云于去年 6 月率先推出 MaaS 互信推理专区方案(以下简称“MaaS 1.0”),在大模型厂商、用户和金山云之间建立互信,以解决模型及数据的互信问题。本次沟通会上,金山云发布 MaaS 互信推理专区方案 2.0(以下简称“MaaS 2.0”)。

 

在 MaaS 1.0 基础上,MaaS 互信推理专区方案 2.0 以金山云 IaaS 和 PaaS 为底座,可实现云上 LangChain 的一键部署,默认对接多个生态合作商业大模型和开源大模型。同时支持包括 BGE、Bert 等在内的 Embedding 模型,能无缝对接金山云全托管向量数据库 Milvus,提供面向企业开发者的简单易用、安全可信的一站式推理应用部署平台。此外,MaaS 2.0 支持通过标准化的 API 接口和 Web 前端界面,实现包括模型推理和知识库搭建的 RAG 大模型场景应用。为进一步增强云上运行的安全性,MaaS 2.0 还提供容器服务加密镜像解决方案,依托金山云裸金属服务,实现在金山云容器服务中从镜像加密、加密镜像上传、解密镜像运行的全流程模型安全运行。

 

同时,为满足行业客户的需求,金山云探索大模型时代企业赋能新机遇,围绕企业级知识助手场景制定了“一三一四”产品全景规划,即一套能力(金山云轻舟智问)、三个模型(行业语言模型、文本分片和 Embedding 模型)、一个平台(金山云瀚海平台)及四大功能(微调推理、数据加速、智能检索和文档智能),围绕生成式人工智能构建应用落地、模型训练微调、平台支撑的全栈能力。基于“一三一四”规划,金山云将分别针对应用型客户和平台型客户输出多项原子能力。目前,金山云轻舟智问知识助手产品已完成应用以及 Embedding 模型、多路召回算法和智能数据切片模型等核心技术的建设,计划优先在公共服务和法律场景落地。

 

与人工智能的结合,给了云更多的想象空间,也给各行业都带来了新的生产力。随着技术的进一步完善和落地,云计算将迎来更强更久的生命力。金山云将持续围绕客户需求“练内功”,携手生态伙伴以差异化打法布局未来。

2024-02-01 16:099074
用户头像
李冬梅 加V:busulishang4668

发布了 1209 篇内容, 共 834.3 次阅读, 收获喜欢 1314 次。

关注

评论

发布
暂无评论
发现更多内容

ETL参数化技巧:如何避免写一堆重复任务?

谷云科技RestCloud

数据处理 数据传输 ETL 数据集成平台 参数传递

网易伏羲受邀亮相2025云栖大会,展示AI领域前沿创新成果

网易伏羲

网易伏羲 游戏AI 具身智能 群体智能 网易雷火

招聘效率坍塌?AI+真人面试已成主流,你还在用石器时代的方法选人?

AI得贤招聘官

解密YashanDB数据库的高并发处理机制

数据库砖家

除了Nano banana,还有哪些AI工具可以生成手办模型图?

职场工具箱

AIGC 通义千问 Ai绘图 Qwen AI生图

数造科技于2025全球数据管理峰会斩获多项殊荣

数造万象

数据治理 DataOps 数据管理 AI 人工智能 科技、

基于YashanDB数据库构建实时监控系统的实施步骤

数据库砖家

揭示YashanDB数据库在大数据时代的价值

数据库砖家

YashanDB 对云环境适配能力

数据库砖家

阿里云发布《AI 原生应用架构白皮书》

阿里巴巴云原生

阿里云 云原生

百度电商MultiAgent视频生成系统

百度Geek说

视频创作 AIGC

TapTalk | 圆桌实录:澳门综合度假村敏捷转型之旅,MongoDB + TapData 赋能酒店业卓越实践

tapdata

客户数据平台 CDP 敏捷转型 CDC 实时数据平台

解读YashanDB的并发处理能力:推动业务增长的关键

数据库砖家

文心快码已接入GLM-4.6模型

Comate编码助手

AI编程 文心快码 AI编程助手 GLM-4.6

京东正式开源基于国产芯片自研的xLLM大模型推理引擎

京东零售技术

结合AI技术提升YashanDB数据库智能运维能力

数据库砖家

解密YashanDB的先进存储架构及其优势

数据库砖家

解析YashanDB数据库与区块链技术的结合

数据库砖家

解锁YashanDB数据库的强大API接口功能

数据库砖家

一键登录技术横评:MobTech秒验如何提升APP转化率35%?

MobTech袤博科技

智源 RoboBrain-X0 开源,打破机器人跨本体泛化困境

智源研究院

VEX生态重磅孵化STC:打造Web3 ESG碳资产RWA第一标杆

科技汇

节省成本提升效率:YashanDB数据库云端部署策略详解

数据库砖家

结合YashanDB其功能可以有效提升企业的数据洞察力

数据库砖家

YashanDB 是一款高性能、灵活且可扩展的数据库系统

数据库砖家

网易雷火胡志鹏:AI驱动未来,游戏科技重塑虚拟创造力与现实生产力

网易伏羲

人工智能 网易伏羲 具身智能 网易雷火 游戏科技

低代码5大实用模块实操指南:收藏/公告/消息/统计/服务器信息

引迈信息

Qoder 负责人揭秘:Qoder 产品背后的思考与未来发展

阿里巴巴云原生

阿里云 云原生 Qoder

两项世界第一!阿里云EMR登顶全球数据仓库性能及性价比排行榜

阿里云大数据AI技术

spark 阿里云 数据仓库 StarRocks EMR

金山云升级全栈云计算体系,全方位承接大模型应用_AI 工程化_李冬梅_InfoQ精选文章