2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

深信服一朵云面向 AI 升级,不止承载 DeepSeek,更支持深度 AI 应用创新

  • 2025-02-17
    北京
  • 本文字数:1829 字

    阅读完需:约 6 分钟

大小:962.02K时长:05:28
深信服一朵云面向AI升级,不止承载DeepSeek,更支持深度AI应用创新

近日,深信服一朵云面向 AI 进行全新升级:为用户打造更匹配大模型场景的智算承载、应用构建的 AI 平台,面向用户基于 DeepSeek 承载和应用的场景,提供一键部署、性能更优、快速开发应用的最佳实践方案。

 

总的来说,升级包含三个方面:


  • 线下基础设施从传统业务承载平台向智算承载平台升级,广泛适配包括 DeepSeek 在内的最新大模型。

  • 线上托管云上线全新 AI 服务目录,提供 DeepSeek 等企业级大模型服务,用户可通过订阅来快速获取 AI 能力。

  • 全新发布 AI 应用创新平台,助力用户快速构建大模型应用,让 AI 应用的开发和运营变得更简单。

 

向 AI 升级后,深信服全面优化推理性能,让跑在一朵云上的大模型应用可以实现推理性能的大幅提升,降低大模型整体使用成本。

 

相比基于个人开发者常用的 Ollama 方案部署 DeepSeek,深信服通过 AICP 算力平台的部署方案在多实例、并发推理场景中可实现 5-10 倍的性能提升。大模型并发度更高、吞吐量更大、推理响应延时更低,让用户在企业级 AI 应用构建及实际使用时,资源投入更低、体验更优。

 

通过一个问答测试场景演示,可以直观地感受效果:深信服(左侧)提供的推理速度更快,用户体验更好。


4卡4090运行DeepSeek-32B模型,模拟64并发场景,做问答测试


以 32B 模型为例,日常问答场景(2k 上下文),AICP 并发是 Ollama 的 8~10 倍,总吞吐 10 倍以上。


硬件资源:INT4用2*4090,FP16用4*4090


 知识库应用场景(4k 上下文),AICP 并发是 Ollama 的 2 倍,总吞吐 4~8 倍


硬件资源:INT4用2*4090,FP16用4*4090


具体而言,深信服可为用户提供:

 

1、HCI+AICP 算力平台:新一代超融合方案,更适合部署 DeepSeek 等企业级大模型

 

深信服现已打造「HCI+AICP 新一代超融合」解决方案,只需在原集群基础上增加一台 GPU 节点,就能基于本地集群快速部署并承载 DeepSeek 在内的企业级大模型。

 

无需重构原有基础框架,通过「新一代超融合」升级,基础设施即可完成从传统承载平台向智算承载平台的演进。所有承载通算、智算的集群资源都可以在信服云管理平台 SCP 上进行统一纳管。同时,平台支持大模型和小模型混合部署,实现资源的自动化调度,更大程度优化算力资源的利用率。

 

除了推理性能优化、部署与管理便捷,深信服 AICP 算力平台还提供了向导化的配置,实现一键训练,帮助用户开发垂直领域大模型,大幅降低研发门槛和成本。结合模型加密技术,有效保护用户知识产权,防止“模型资产”泄露。

 

同时,除了支持英伟达 GPU,深信服 AICP 算力平台和多家国产厂商开展了广泛的软硬件兼容测试,可适配天数智芯、昇腾、海光、沐曦、燧原等多款国产卡,为用户实现算力异构管理。

 

2、线上服务目录向 AI 升级,快速订阅 DeepSeek 等大模型资源与服务

 

这次一朵云面向 AI 升级,深信服对线上服务目录也做了相应的扩展。

 

深信服托管云已支持基于专属资源+AICP 的方式,为用户提供专属的企业级大模型服务,可满足用户对于线上部署专属服务模型的需求。

 

未来,深信服会持续丰富线上服务目录,用户可以很容易地通过订阅的方式,快速平滑地获取 AI 能力,如 DeepSeek 等模型服务。

 

3、AI 应用创新平台全新发布,让大模型应用构建更简单

 

随着开源模型的不断发展,大模型承载愈发成为基础需求,各行业用户也正进一步关注如何快速构建应用并在实际业务中发挥价值。对此,深信服全新推出 AI 应用创新平台,助力用户更简单地完成 AI 应用的开发和运营。



1)、更简单的应用构建


深信服 AI 应用创新平台内置 RAG 最佳实践流程,支持智能分片与直连企业自有知识库。用户仅需通过简单操作,即可构建高质量的 RAG 应用(如智能客服、知识问答系统等)。

 

在生成阶段,用户可自主选择切换主流模型,比如使用基于深信服一朵云的方案线上或线下部署 DeepSeek 模型服务。这一功能相当于为用户打造了一个“懂业务知识”的专属 AI 应用——既深度结合企业内部知识沉淀,又无缝调用 DeepSeek 等先进模型能力,实现从数据到业务场景的精准匹配。

 

2)、更低门槛的数据调优


深信服 AI 应用创新平台支持基于业务评测数据集的应用效果评估,并自动生成优化建议,用户无需理解复杂技术细节,即可完成配置优化,实现效果提升。

 

3)、更高效的数据运营


应用发布后,平台通过 AI 智能识别用户反馈中的高频问题,并结合业务场景推荐优化策略。用户可通过运营→评估→调优的闭环,实现 AI 应用的「越用越聪明」,将传统开发中依赖技术团队的“黑盒”过程,转化为业务人员可自主驱动的数据运营。

 

通过这一平台,AI 应用的开发流程被简化为「数据运营」。用户只需聚焦业务需求、数据质量与应用效果,无需依赖 AI 技术专家即可完成迭代,助力用户以更低成本、更高效率挖掘 AI 在业务场景中的潜力。


接下来,深信服将为用户解锁围绕 DeepSeek 场景的最佳实践、应用构建方法及一朵云承载方案。

2025-02-17 17:538440

评论

发布
暂无评论
发现更多内容

等保备案证明更新

等保测评

亚马逊宣布投资100亿美元在北卡罗来纳州建设数据中心以支持AI扩展

PowerVerse

人工智能 AI 数据 去中心化云算力

2025 深度洞察:AI Agent 落地的短板有哪些

Techinsight

商品中心—B端建品和C端缓存的技术文档(二)

电子尖叫食人鱼

架构

Steinberg Cubase Pro for mac14.0.30 多功能音乐制作

晨光熹微

AI+制造:用友BIP智能裁切,突破造纸行业效率革命

用友BIP

AI

三类不同身份的“开发者”,在昇腾CANN的土壤上种下了繁荣之花

Alter

商品中心—B端建品和C端缓存的技术文档

电子尖叫食人鱼

架构

立足数字人文,深化历史叙事|科学智能赋能人文社科领域研究

ModelWhale

科学智能 人文社科 山东大学 AI4S

单据流那些事儿之手工生单串讲

inBuilder低代码平台

通义灵码带你玩转 MCP 最佳实践(合辑,持续更新中)

阿里巴巴云原生

通义灵码 MCP

通义灵码带你玩转 MCP 最佳实践(合辑,持续更新中)

阿里云云效

通义灵码 MCP

Steinberg Dorico Pro for mac 6.0.10 乐谱编写制作

晨光熹微

用友BIP开启「人+智能体+群」业务协同新模式

用友BIP

AI

Techub News Web3小科普:什么是稳定币

TechubNews

指标体系建设的本质与落地逻辑——从战略到执行的闭环管理

Aloudata

数据分析 指标体系 指标管理 指标平台 指标开发

技术视角:AI Agent 落地局限与产品实现

Techinsight

智能体 Agents AI 智能体 智能体评估

全议程硬核公布!龙蜥邀您共同探索面向泛在智算场景的操作系统技术

OpenAnolis小助手

AI 操作系统 龙蜥社区 龙蜥meetup

Dify实战案例:MySQL查询助手!嘎嘎好用

王磊

鸿蒙Next仓颉语言开发实战教程:下拉刷新和上拉加载更多

幽蓝计划

基于YOLOv8的交通标识及设施识别项目|完整源码数据集+PyQt5界面+完整训练流程+开箱即用!

申公豹

yolov8

等保测评:差距测评

等保测评

秒懂 AI Agent:落地局限与产品解析

Techinsight

智能体 agent 智能体评估

华为仓颉语言初识:并发编程之同步机制(下)

IT小码哥

鸿蒙 HarmonyOS HarmonyOS NEXT

算力不再是瓶颈?看DeepSeek如何颠覆AI发展逻辑

GPU算力

强化学习 算力 AI算法 深度学习、 DeepSeek

龙蜥开发者说:我的龙蜥开源之旅 | 第 32 期

OpenAnolis小助手

龙蜥社区 龙蜥开发者说

假如给你1亿的Redis key,如何高效统计?

不在线第一只蜗牛

数据库 redis

揭秘:AI Agent落地难在哪,产品又咋样?

Techinsight

智能体 AI 智能体

KubeCon China 2025 | 与KubeEdge畅聊毕业经验与创新未来

华为云原生团队

云计算 容器 云原生

五分钟搭建属于你的AI助手:Ollama+DeepSeek+AnythingLLM深度整合教程

量贩潮汐·WholesaleTide

人工智能 DeepSeek

Steinberg HALion for mac 虚拟采样与声音合成

晨光熹微

深信服一朵云面向AI升级,不止承载DeepSeek,更支持深度AI应用创新_云计算_深信服_InfoQ精选文章