阿里云飞天发布时刻,领先大模型限免,超7000万 tokens免费体验 了解详情
写点什么

深信服一朵云面向 AI 升级,不止承载 DeepSeek,更支持深度 AI 应用创新

  • 2025-02-17
    北京
  • 本文字数:1829 字

    阅读完需:约 6 分钟

大小:962.02K时长:05:28
深信服一朵云面向AI升级,不止承载DeepSeek,更支持深度AI应用创新

近日,深信服一朵云面向 AI 进行全新升级:为用户打造更匹配大模型场景的智算承载、应用构建的 AI 平台,面向用户基于 DeepSeek 承载和应用的场景,提供一键部署、性能更优、快速开发应用的最佳实践方案。

 

总的来说,升级包含三个方面:


  • 线下基础设施从传统业务承载平台向智算承载平台升级,广泛适配包括 DeepSeek 在内的最新大模型。

  • 线上托管云上线全新 AI 服务目录,提供 DeepSeek 等企业级大模型服务,用户可通过订阅来快速获取 AI 能力。

  • 全新发布 AI 应用创新平台,助力用户快速构建大模型应用,让 AI 应用的开发和运营变得更简单。

 

向 AI 升级后,深信服全面优化推理性能,让跑在一朵云上的大模型应用可以实现推理性能的大幅提升,降低大模型整体使用成本。

 

相比基于个人开发者常用的 Ollama 方案部署 DeepSeek,深信服通过 AICP 算力平台的部署方案在多实例、并发推理场景中可实现 5-10 倍的性能提升。大模型并发度更高、吞吐量更大、推理响应延时更低,让用户在企业级 AI 应用构建及实际使用时,资源投入更低、体验更优。

 

通过一个问答测试场景演示,可以直观地感受效果:深信服(左侧)提供的推理速度更快,用户体验更好。


4卡4090运行DeepSeek-32B模型,模拟64并发场景,做问答测试


以 32B 模型为例,日常问答场景(2k 上下文),AICP 并发是 Ollama 的 8~10 倍,总吞吐 10 倍以上。


硬件资源:INT4用2*4090,FP16用4*4090


 知识库应用场景(4k 上下文),AICP 并发是 Ollama 的 2 倍,总吞吐 4~8 倍


硬件资源:INT4用2*4090,FP16用4*4090


具体而言,深信服可为用户提供:

 

1、HCI+AICP 算力平台:新一代超融合方案,更适合部署 DeepSeek 等企业级大模型

 

深信服现已打造「HCI+AICP 新一代超融合」解决方案,只需在原集群基础上增加一台 GPU 节点,就能基于本地集群快速部署并承载 DeepSeek 在内的企业级大模型。

 

无需重构原有基础框架,通过「新一代超融合」升级,基础设施即可完成从传统承载平台向智算承载平台的演进。所有承载通算、智算的集群资源都可以在信服云管理平台 SCP 上进行统一纳管。同时,平台支持大模型和小模型混合部署,实现资源的自动化调度,更大程度优化算力资源的利用率。

 

除了推理性能优化、部署与管理便捷,深信服 AICP 算力平台还提供了向导化的配置,实现一键训练,帮助用户开发垂直领域大模型,大幅降低研发门槛和成本。结合模型加密技术,有效保护用户知识产权,防止“模型资产”泄露。

 

同时,除了支持英伟达 GPU,深信服 AICP 算力平台和多家国产厂商开展了广泛的软硬件兼容测试,可适配天数智芯、昇腾、海光、沐曦、燧原等多款国产卡,为用户实现算力异构管理。

 

2、线上服务目录向 AI 升级,快速订阅 DeepSeek 等大模型资源与服务

 

这次一朵云面向 AI 升级,深信服对线上服务目录也做了相应的扩展。

 

深信服托管云已支持基于专属资源+AICP 的方式,为用户提供专属的企业级大模型服务,可满足用户对于线上部署专属服务模型的需求。

 

未来,深信服会持续丰富线上服务目录,用户可以很容易地通过订阅的方式,快速平滑地获取 AI 能力,如 DeepSeek 等模型服务。

 

3、AI 应用创新平台全新发布,让大模型应用构建更简单

 

随着开源模型的不断发展,大模型承载愈发成为基础需求,各行业用户也正进一步关注如何快速构建应用并在实际业务中发挥价值。对此,深信服全新推出 AI 应用创新平台,助力用户更简单地完成 AI 应用的开发和运营。



1)、更简单的应用构建


深信服 AI 应用创新平台内置 RAG 最佳实践流程,支持智能分片与直连企业自有知识库。用户仅需通过简单操作,即可构建高质量的 RAG 应用(如智能客服、知识问答系统等)。

 

在生成阶段,用户可自主选择切换主流模型,比如使用基于深信服一朵云的方案线上或线下部署 DeepSeek 模型服务。这一功能相当于为用户打造了一个“懂业务知识”的专属 AI 应用——既深度结合企业内部知识沉淀,又无缝调用 DeepSeek 等先进模型能力,实现从数据到业务场景的精准匹配。

 

2)、更低门槛的数据调优


深信服 AI 应用创新平台支持基于业务评测数据集的应用效果评估,并自动生成优化建议,用户无需理解复杂技术细节,即可完成配置优化,实现效果提升。

 

3)、更高效的数据运营


应用发布后,平台通过 AI 智能识别用户反馈中的高频问题,并结合业务场景推荐优化策略。用户可通过运营→评估→调优的闭环,实现 AI 应用的「越用越聪明」,将传统开发中依赖技术团队的“黑盒”过程,转化为业务人员可自主驱动的数据运营。

 

通过这一平台,AI 应用的开发流程被简化为「数据运营」。用户只需聚焦业务需求、数据质量与应用效果,无需依赖 AI 技术专家即可完成迭代,助力用户以更低成本、更高效率挖掘 AI 在业务场景中的潜力。


接下来,深信服将为用户解锁围绕 DeepSeek 场景的最佳实践、应用构建方法及一朵云承载方案。

2025-02-17 17:538072

评论

发布
暂无评论
发现更多内容

Newbe.Claptrap 框架如何实现在多种框架之上运行?

newbe36524

Docker 云计算 微服务 .net core ASP.NET Core

误执行 rm -fr /*,我删删删删库了,要跑路吗?

小林coding

Linux 程序人生 Shell linux命令

对待一件事,从不喜欢再到喜欢,转变需要多大

良知犹存

程序人生

「C++ 篇」答应我,别再 if else 走天下了可以吗

小林coding

c++ 编程 设计模式 编程习惯 编程风格

字节跳动想招什么样的技术人?

池建强

优化教育体验 智微智能高品质录播系统

InfoQ_967a83c6d0d7

精美前端UI(VUE)界面,ASP.NET通用工作流开发分享

雯雯写代码

工作流 可视化

全球移动服务生态的暗涌与新机

脑极体

gRPC在Spring Cloud中的应用

xcbeyond

Java gRPC SpringCloud

为什么使用Portainer,而不是Docker CLI来管理Docker环境

xcbeyond

Docker 运维 Portainer

从根上学习Git

书旅

git 工具 版本控制 版本管理工具

为什么直播系统不用RTP协议

soolaugust

WebRTC 直播 RTMP rtp

大数据技术发展(一):大数据技术的起源

cristal

Java 大数据 hadoop

为什么你做的 Excel 表不好用?

Tony Wu

效率工具 产品设计 Excel ER图

SpringCloud(Netflix)-技术专题-微服务入门介绍

码界西柚

直播技术的背后--RTMP协议

soolaugust

直播 RTMP

国内首家 ABM 营销技术服务商火眼云完成5000万元A轮融资

人称T客

HTTP协议-基础

Jaykey

大前端 HTTP

C++ 深入浅出工厂模式(初识篇)

小林coding

c++ 设计模式 工厂模式

Web 全栈开发利器: 强大的在线 Cloud IDE

华为云开发者联盟

Web python3.x 全栈 编码 CloudIDE

2020大厂web前端面试常见问题总结

华为云开发者联盟

CSS 面试 响应式 大前端 浏览器

修改系统时间,导致 sem_timedwait 一直阻塞的问题解决和分析

小林coding

Linux 编程 问题处理

音画同步体验有多好,来看看即构的自研互动白板就知道啦

ZEGO即构

在线教育 SVG canvas

C++ this指针的理解和作用

小林coding

c c++ 指针

HTTP协议-进阶

Jaykey

大前端 HTTP

C++ 深入浅出工厂模式(进阶篇)

小林coding

c++ 设计模式 工厂模式

超超超全递归技巧讲解,这次带你拿下递归

多选参数

数据结构 算法 递归 数据结构与算法

Spring Boot Actuator微服务服务监控

xcbeyond

Java 微服务 springboot actuator 服务监控

老张「原创小说」

瓜藤老祖

个人成长

第二次推荐笔记:wolai

申屠鹏会

让类/进程/脚本「单身」的方法

小林coding

c c++ Shell 设计模式 单例模式

深信服一朵云面向AI升级,不止承载DeepSeek,更支持深度AI应用创新_云计算_深信服_InfoQ精选文章