写点什么

GMI Cloud 上架基于英伟达 H200 的 DeepSeek 系列模型!

  • 2025-02-07
    北京
  • 本文字数:1244 字

    阅读完需:约 4 分钟

大小:571.05K时长:03:14
GMI Cloud 上架基于英伟达 H200 的 DeepSeek 系列模型!

摘要:

为了让更多 AI 企业体验 DeepSeek - R1 推理端点,GMI Cloud 特别推出限免体验 2 天活动!识别文中二维码,即刻获取体验资格,完成一键部署!


1 月下旬,DeepSeek 推出性能媲美 OpenAI o1 模型的推理模型 R1,不仅成本远低于 o1 而且还开源,API 付费价格也远低于 o1,一经发出,立刻引起了 AI 圈的广泛关注。


一周后的除夕当天,DeepSeek 再次推出并开源了多模态人工智能模型 Janus-Pro,一款基于 DeepSeek-LLM-1.5b-base 和 DeepSeek-LLM-7b-base 构建的模型。在这系列模型中,Janus-Pro-7B 在 GenEval 和 DPG-Bench 基准测试中,在文本生成、语义理解、知识问答等关键任务上,击败了 OpenAI 的 DALL-E 3 和 Stable Diffusion,直接将国内外 AI 狂欢推向高潮。


据悉,DeepSeek 在 GitHub 开源后,代码库快速吸引大量开发者关注,star 数短期内突破十万,且众多基于 DeepSeek 的二次开发项目如代码自动补全、智能文档摘要等,已在金融、医疗、科研等多领域实现高效部署,有力推动了 AI 应用的创新与落地。


而在这个过程中,GMI Cloud 技术团队第一时间在北美完成了对 DeepSeek R1 基于英伟达当前量产最强的 H200 GPU 服务器的部署适配和优化,构建了专属 DeepSeek - R1 推理端点!


为了让更多 AI 企业进行体验,GMI Cloud 本周正式推出限免体验 2 天活动!识别下方二维码,即刻获取体验资格,完成一键部署!



技术细节


模型提供商:DeepSeek

模型名称:DeepSeek-R1

类型:聊天模型

参数:6850 亿

部署方式:专用端点(可动态扩容)

量化方式:FP8

上下文长度:该模型在单个会话中,能够处理 128,000 tokens


此外,GMI Cloud 还提供以下模型:

DeepSeek-R1-Distill-Llama-70B

DeepSeek-R1-Distill-Qwen-32B

DeepSeek-R1-Distill-Qwen-14B

DeepSeek-R1-Distill-Llama-8B

DeepSeek-R1-Distill-Qwen-7B

DeepSeek-R1-Distill-Qwen-1.5B


敏捷部署


1、与 GMI Cloud 建立链接

2、创建模型包

3、部署

“if name == 'main':    # Initialize the Client    cli = Client()    # Create an artifact from a template    artifact_id = create_artifact_from_template(cli,"deepseek_r1_template_001")    # Create a task and start it    task_id = create_task_and_start(cli, artifact_id)    # Call chat completion    print(call_chat_completion(cli, task_id))”
复制代码


SDK 部署示例:

https://github.com/GMISWE/python-sdk/blob/main/examples/deepseek_r1.py



关于 GMI Cloud

由 Google X 的 AI 专家与硅谷精英共同参与创立的 GMI Cloud 是一家领先的 AI Native Cloud 服务商,拥有遍布全球的数据中心网络,为企业 AI 应用提供最新、最优的 GPU 资源,为全球新创公司、研究机构和大型企业提供稳定安全、高效经济的 AI 云服务解决方案。GMI Cloud 凭借高稳定性的技术架构、强大的 GPU 供应链以及令人瞩目的 GPU 产品阵容(如拥有 AI 强大算力的 H100;能够精准平衡 AI 成本与效率的 H200;以及未来即将上线的具有卓越性能的 GB200 等),确保企业客户在高度数据安全与计算效能的基础上,高效低本地完成 AI 落地。

2025-02-07 09:189793

评论

发布
暂无评论

书单 | 读了这10本书,再也不怕黑客攻击了

博文视点Broadview

你真的了解Redis单线程为什么如此之快吗?

Linux服务器开发

数据库 redis 多线程 Linux服务器开发 单线程

人民币突传大好消息,首款数字货币“官宣”了!

CECBC

得物技术沙龙iOS专场

得物技术

ios 分享 周报 技术分享 技术沙龙

【通知】2021年“绿城杯”网络安全大赛开始报名啦!

郑州埃文科技

C++20 Concepts 极简介绍

董一凡

c++

30天读完300页,这份Alibaba面试通关手册,助我“闯进”字节跳动拿下offer

Java spring 编程 架构

【WIC•资讯】世界智能大会组委会秘书处祝贺 2021中国(天津)非公有制经济发展论坛圆满召开

InfoQ 天津

足以封神的SpringCloudAlibaba问世,看过的人都已经“登仙”了

Java 程序员 面试 springboot 计算机

孕蕾、护花、促果:展锐深耕芯片“三步曲”

脑极体

极客时间企业版|数字化转型专题讲座天津站圆满结束

InfoQ 天津

LDAP是什么意思?有什么用?

行云管家

运维 服务器 AD域 目录

Growing 账号认证实践

GrowingIO技术专栏

spring security CAS SSO ldap

得偿所愿!字节4面斩下2-2Offer,入职就是30K16薪,相信你们也可以!

Java 程序员 字节跳动 面试 计算机

Pulsar 用户案例|消息队列上云挑战与方案:腾讯云的 Apache Pulsar 实践

Apache Pulsar

Apache Pulsar

CANN AICPU算子耗时分析及优化探索

华为云开发者联盟

tensorflow 测试 算子 CANN算子 算子耗时

【等保三级】过等保三级需要哪些设备?大概多少钱?

行云管家

网络安全 信息安全 等保 堡垒机 等保三级

Phaser类在性能测试中应用

FunTester

多线程 性能测试 测试框架 FunTester phaser

解析鸿蒙内核消息队列QueueMail接口的哼哈二将

华为云开发者联盟

鸿蒙 接口 队列 消息队列 QueueMail

区块链 ≠ 分布式存储

趣链科技

区块链 分布式 存储

隐私计算﹢区块链:让数据真正成为生产要素

CECBC

数据通信网络基础

Regan Yue

华为数据通信 9月日更 数据通信

一文搞懂如何使用Node.js进行TCP网络通信

华为云开发者联盟

node.js TCP 网络 网络通信 TCP服务器

聊聊汽车ECU中单片机开发

SOA开发者

车载控制单元

滨海新区新的社会阶层人士开展“寻美.天津”主题活动

InfoQ 天津

一周信创舆情观察(9.6~9.12)

统小信uos

产品资讯 | mPaaS 10.1.68 适配 iOS 15

蚂蚁集团移动开发平台 mPaaS

ios 移动开发 mPaaS

架构实战营第一期 -- 模块八作业

clay

架构实战营

字节4轮面试,拿43k*15 Offer!全靠过硬实力+1290题面试神技手册

Java 架构 面试 后端 计算机

基于MySQL binlog日志,实现Elasticsearch近实时同步实践

Java MySQL 编程 架构 计算机

k8s 驱逐pod疑惑

Geek_f24c45

Kubernetes kubelet

GMI Cloud 上架基于英伟达 H200 的 DeepSeek 系列模型!_云计算_鲁冬雪_InfoQ精选文章