2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

深信服一朵云面向 AI 升级,不止承载 DeepSeek,更支持深度 AI 应用创新

  • 2025-02-17
    北京
  • 本文字数:1829 字

    阅读完需:约 6 分钟

大小:962.02K时长:05:28
深信服一朵云面向AI升级,不止承载DeepSeek,更支持深度AI应用创新

近日,深信服一朵云面向 AI 进行全新升级:为用户打造更匹配大模型场景的智算承载、应用构建的 AI 平台,面向用户基于 DeepSeek 承载和应用的场景,提供一键部署、性能更优、快速开发应用的最佳实践方案。

 

总的来说,升级包含三个方面:


  • 线下基础设施从传统业务承载平台向智算承载平台升级,广泛适配包括 DeepSeek 在内的最新大模型。

  • 线上托管云上线全新 AI 服务目录,提供 DeepSeek 等企业级大模型服务,用户可通过订阅来快速获取 AI 能力。

  • 全新发布 AI 应用创新平台,助力用户快速构建大模型应用,让 AI 应用的开发和运营变得更简单。

 

向 AI 升级后,深信服全面优化推理性能,让跑在一朵云上的大模型应用可以实现推理性能的大幅提升,降低大模型整体使用成本。

 

相比基于个人开发者常用的 Ollama 方案部署 DeepSeek,深信服通过 AICP 算力平台的部署方案在多实例、并发推理场景中可实现 5-10 倍的性能提升。大模型并发度更高、吞吐量更大、推理响应延时更低,让用户在企业级 AI 应用构建及实际使用时,资源投入更低、体验更优。

 

通过一个问答测试场景演示,可以直观地感受效果:深信服(左侧)提供的推理速度更快,用户体验更好。


4卡4090运行DeepSeek-32B模型,模拟64并发场景,做问答测试


以 32B 模型为例,日常问答场景(2k 上下文),AICP 并发是 Ollama 的 8~10 倍,总吞吐 10 倍以上。


硬件资源:INT4用2*4090,FP16用4*4090


 知识库应用场景(4k 上下文),AICP 并发是 Ollama 的 2 倍,总吞吐 4~8 倍


硬件资源:INT4用2*4090,FP16用4*4090


具体而言,深信服可为用户提供:

 

1、HCI+AICP 算力平台:新一代超融合方案,更适合部署 DeepSeek 等企业级大模型

 

深信服现已打造「HCI+AICP 新一代超融合」解决方案,只需在原集群基础上增加一台 GPU 节点,就能基于本地集群快速部署并承载 DeepSeek 在内的企业级大模型。

 

无需重构原有基础框架,通过「新一代超融合」升级,基础设施即可完成从传统承载平台向智算承载平台的演进。所有承载通算、智算的集群资源都可以在信服云管理平台 SCP 上进行统一纳管。同时,平台支持大模型和小模型混合部署,实现资源的自动化调度,更大程度优化算力资源的利用率。

 

除了推理性能优化、部署与管理便捷,深信服 AICP 算力平台还提供了向导化的配置,实现一键训练,帮助用户开发垂直领域大模型,大幅降低研发门槛和成本。结合模型加密技术,有效保护用户知识产权,防止“模型资产”泄露。

 

同时,除了支持英伟达 GPU,深信服 AICP 算力平台和多家国产厂商开展了广泛的软硬件兼容测试,可适配天数智芯、昇腾、海光、沐曦、燧原等多款国产卡,为用户实现算力异构管理。

 

2、线上服务目录向 AI 升级,快速订阅 DeepSeek 等大模型资源与服务

 

这次一朵云面向 AI 升级,深信服对线上服务目录也做了相应的扩展。

 

深信服托管云已支持基于专属资源+AICP 的方式,为用户提供专属的企业级大模型服务,可满足用户对于线上部署专属服务模型的需求。

 

未来,深信服会持续丰富线上服务目录,用户可以很容易地通过订阅的方式,快速平滑地获取 AI 能力,如 DeepSeek 等模型服务。

 

3、AI 应用创新平台全新发布,让大模型应用构建更简单

 

随着开源模型的不断发展,大模型承载愈发成为基础需求,各行业用户也正进一步关注如何快速构建应用并在实际业务中发挥价值。对此,深信服全新推出 AI 应用创新平台,助力用户更简单地完成 AI 应用的开发和运营。



1)、更简单的应用构建


深信服 AI 应用创新平台内置 RAG 最佳实践流程,支持智能分片与直连企业自有知识库。用户仅需通过简单操作,即可构建高质量的 RAG 应用(如智能客服、知识问答系统等)。

 

在生成阶段,用户可自主选择切换主流模型,比如使用基于深信服一朵云的方案线上或线下部署 DeepSeek 模型服务。这一功能相当于为用户打造了一个“懂业务知识”的专属 AI 应用——既深度结合企业内部知识沉淀,又无缝调用 DeepSeek 等先进模型能力,实现从数据到业务场景的精准匹配。

 

2)、更低门槛的数据调优


深信服 AI 应用创新平台支持基于业务评测数据集的应用效果评估,并自动生成优化建议,用户无需理解复杂技术细节,即可完成配置优化,实现效果提升。

 

3)、更高效的数据运营


应用发布后,平台通过 AI 智能识别用户反馈中的高频问题,并结合业务场景推荐优化策略。用户可通过运营→评估→调优的闭环,实现 AI 应用的「越用越聪明」,将传统开发中依赖技术团队的“黑盒”过程,转化为业务人员可自主驱动的数据运营。

 

通过这一平台,AI 应用的开发流程被简化为「数据运营」。用户只需聚焦业务需求、数据质量与应用效果,无需依赖 AI 技术专家即可完成迭代,助力用户以更低成本、更高效率挖掘 AI 在业务场景中的潜力。


接下来,深信服将为用户解锁围绕 DeepSeek 场景的最佳实践、应用构建方法及一朵云承载方案。

2025-02-17 17:538423

评论

发布
暂无评论
发现更多内容

【Abyss】Android平台应用级系统调用拦截框架

iofomo

android 安全 拦截器

功能强大的矢量绘图软件 EazyDraw for Mac v11.8.2中文版

Rose

Termius (终端模拟器/ssh/sftp客户端软件)

Rose

FotoMagico for Mac(专业幻灯片制作软件)v6.7.2激活版

Rose

“量体裁衣”破局转型难题!广域铭岛助力智转数改跑出加速度

极客天地

探索淘宝API:解锁关键词搜索商品列表的无限可能

代码忍者

API 接口 pinduoduo API

Qbserve for Mac 提高工作效率 v1.9激活版

Rose

联想正式在印度生产AI服务器!致力于在印度开发世界“尖端”技术真的能实现吗?|AI日报

可信AI进展

黄石等保测评机构有哪些?在哪里?

行云管家

等保 黄石

GPUStack 0.2:开箱即用的分布式推理、CPU推理和调度策略

GPUStack

AI 大模型 生成式AI LLM GPU集群

Axure RP 10中文授权版永久使用 mac/win

Rose

vivo 全链路多版本开发测试环境落地实践

vivo互联网技术

测试环境 流量染色

LeetCode:240. 搜索二维矩阵 II,二分查找,详细注释

Lee Chen

Path Finder for Mac(强大的文件管理工具) v2176中文激活版

Rose

苹果电脑数据库管理工具 Valentina Studio Pro for Mac v14.5激活版

Rose

JDK23如约而至,数十种新玩法,你期待哪一种?

江南一点雨

Go 错误处理指北:pkg/errors 源码解读

江湖十年

后端 错误 错误处理 Go 面试题 面经 后端 大厂

搭建 CNode 技术社区智能体

灵快科技

node.js 开源 AI AI 智能体

鸿蒙应用生态构建的核心目标

芯盾时代

鸿蒙

为明天做好准备,摆脱传统财务规划的不足

智达方通

企业管理 企业战略 全面预算管理 全面预算管理系统 财务规划

ps替代品:苹果图像处理软件Acorn for mac注册版

Rose

实用的快速编写代码软件 TeaCode for Mac v1.1.3激活版

Rose

百度智能云x️石家庄交管局,大模型打造全时在线数字交警

百度Geek说

物资堆积如山,管理混乱?这些问题你还在忍受吗?

天津汇柏科技有限公司

低代码开发 软件定制开发 AI人工智能

堡垒机价值主要体现在哪里?可以说说吗?

行云管家

网络安全 堡垒机 IT运维

苹果电脑防火墙软件 Radio Silence for mac v3.3 最新永久密钥

Rose

Caffeinated for Mac(系统防睡眠工具) v2.0.7激活版

Rose

深信服一朵云面向AI升级,不止承载DeepSeek,更支持深度AI应用创新_云计算_深信服_InfoQ精选文章