写点什么

GMI Cloud 上架基于英伟达 H200 的 DeepSeek 系列模型!

  • 2025-02-07
    北京
  • 本文字数:1244 字

    阅读完需:约 4 分钟

大小:571.05K时长:03:14
GMI Cloud 上架基于英伟达 H200 的 DeepSeek 系列模型!

摘要:

为了让更多 AI 企业体验 DeepSeek - R1 推理端点,GMI Cloud 特别推出限免体验 2 天活动!识别文中二维码,即刻获取体验资格,完成一键部署!


1 月下旬,DeepSeek 推出性能媲美 OpenAI o1 模型的推理模型 R1,不仅成本远低于 o1 而且还开源,API 付费价格也远低于 o1,一经发出,立刻引起了 AI 圈的广泛关注。


一周后的除夕当天,DeepSeek 再次推出并开源了多模态人工智能模型 Janus-Pro,一款基于 DeepSeek-LLM-1.5b-base 和 DeepSeek-LLM-7b-base 构建的模型。在这系列模型中,Janus-Pro-7B 在 GenEval 和 DPG-Bench 基准测试中,在文本生成、语义理解、知识问答等关键任务上,击败了 OpenAI 的 DALL-E 3 和 Stable Diffusion,直接将国内外 AI 狂欢推向高潮。


据悉,DeepSeek 在 GitHub 开源后,代码库快速吸引大量开发者关注,star 数短期内突破十万,且众多基于 DeepSeek 的二次开发项目如代码自动补全、智能文档摘要等,已在金融、医疗、科研等多领域实现高效部署,有力推动了 AI 应用的创新与落地。


而在这个过程中,GMI Cloud 技术团队第一时间在北美完成了对 DeepSeek R1 基于英伟达当前量产最强的 H200 GPU 服务器的部署适配和优化,构建了专属 DeepSeek - R1 推理端点!


为了让更多 AI 企业进行体验,GMI Cloud 本周正式推出限免体验 2 天活动!识别下方二维码,即刻获取体验资格,完成一键部署!



技术细节


模型提供商:DeepSeek

模型名称:DeepSeek-R1

类型:聊天模型

参数:6850 亿

部署方式:专用端点(可动态扩容)

量化方式:FP8

上下文长度:该模型在单个会话中,能够处理 128,000 tokens


此外,GMI Cloud 还提供以下模型:

DeepSeek-R1-Distill-Llama-70B

DeepSeek-R1-Distill-Qwen-32B

DeepSeek-R1-Distill-Qwen-14B

DeepSeek-R1-Distill-Llama-8B

DeepSeek-R1-Distill-Qwen-7B

DeepSeek-R1-Distill-Qwen-1.5B


敏捷部署


1、与 GMI Cloud 建立链接

2、创建模型包

3、部署

“if name == 'main':    # Initialize the Client    cli = Client()    # Create an artifact from a template    artifact_id = create_artifact_from_template(cli,"deepseek_r1_template_001")    # Create a task and start it    task_id = create_task_and_start(cli, artifact_id)    # Call chat completion    print(call_chat_completion(cli, task_id))”
复制代码


SDK 部署示例:

https://github.com/GMISWE/python-sdk/blob/main/examples/deepseek_r1.py



关于 GMI Cloud

由 Google X 的 AI 专家与硅谷精英共同参与创立的 GMI Cloud 是一家领先的 AI Native Cloud 服务商,拥有遍布全球的数据中心网络,为企业 AI 应用提供最新、最优的 GPU 资源,为全球新创公司、研究机构和大型企业提供稳定安全、高效经济的 AI 云服务解决方案。GMI Cloud 凭借高稳定性的技术架构、强大的 GPU 供应链以及令人瞩目的 GPU 产品阵容(如拥有 AI 强大算力的 H100;能够精准平衡 AI 成本与效率的 H200;以及未来即将上线的具有卓越性能的 GB200 等),确保企业客户在高度数据安全与计算效能的基础上,高效低本地完成 AI 落地。

2025-02-07 09:189730

评论

发布
暂无评论

可能是Java Stream的最佳实践(一)

ES_her0

28天写作

效率工具分享-Quicker

十天、

效率 效率工具 工具 工具软件

kafka consumer group

Eric

带你快速了解Flutter的发展和应用

anyRTC开发者

flutter 音视频 WebRTC 跨平台 sdk

容器 & 服务:Docker应用的Jenkins构建

程序员架构进阶

Docker 容器 七日更 28天写作 2月春节不断更

Spark Shuffle 内部机制(三)

hanke

大数据 spark 开源 数据

CPU高速缓存与极性代码设计

华为云开发者联盟

缓存 数据 cpu 存储

(28DW-S8-Day4) 区块链里面2个核心问题

mtfelix

28天写作

几个小实践带你快速上手MindSpore

华为云开发者联盟

华为 AI mindspore 智慧终端 端边云

Python入门-位运算

123568

Python 入门 位运算

日记 2021年2月24日(周三)

Changing Lin

2月春节不断更

c语言简介

Geek_f510ff

c C语言

我与声网Agora

june

新病毒兼容M1芯片,已经感染3万台Mac

Geek_b0cff7

得不到的永远在骚动——蔡格尼克效应

Justin

心理学 习惯养成 28天写作 游戏设计

设计模式之代理模式

Geek_7cf491

Java 设计模式 代理模式

以AI之名 | 给千万级合同管理安上“AI”,华为商务经理工作量大解放!

华为云开发者联盟

人工智能 华为 合同 商务 合同管理

BFF (Backend for frontend)避坑指南

码猿外

架构 微服务 BFF

Kafka.06 - 数据持久化介绍

insight

kafka 2月春节不断更

程序员成长第十五篇:编码的注意事项

石云升

程序员 28天写作 2月春节不断更

cobra-强大的CLI应用程序库

happlyfox

GitHub cli 28天写作 2月春节不断更 Go 语言

2019年度CMMI V2.0性能报告

IPD产品研发管理

产品 项目管理 性能 质量 CMMI

基于matlab的控制系统与仿真3-根轨迹、bode图、Nyquist图

AXYZdong

matlab 2月春节不断更

2021MWC上海召开丨5G与千行百业“和合共生”

云计算

华云·云场景应用详解|安超DCM给数据中心“做主”

华云数据

Elasticsearch入门,这一篇就够了

知南茶温暖

浅谈Python中遇到extend和append,该怎么区别使用

莫陌默

Python 列表 函数

jupyter在加载pkl文件时报错ModuleNotFoundError: No module named 'pandas.core.internals.managers'; '的解决方法

无极限

Python Jupyter Notebook jupyter

修改OpenCV一行代码,提升14%图像匹配效果

Smile

机器学习 OpenCV Python Turtle 图像处理

windows10+python3.8.0(anaconda)+MeCab安装总结

lauqasim

Python Mecab 日文分词

Mybatis association关联查询

フェイト ゼロ

GMI Cloud 上架基于英伟达 H200 的 DeepSeek 系列模型!_云计算_鲁冬雪_InfoQ精选文章