2天时间,聊今年最热的 Agent、上下文工程、AI 产品创新等话题。2025 年最后一场~ 了解详情
写点什么

IBM 在 watsonx.ai 上提供 DeepSeek R1 蒸馏模型

IBM

  • 2025-02-11
    北京
  • 本文字数:1508 字

    阅读完需:约 5 分钟

IBM在watsonx.ai 上提供DeepSeek R1 蒸馏模型

作者:IBM watsonx.ai 产品主管 Maryam Ashoori、IBM AI 平台(watsonx.ai 和 watsonx.governance)产品管理副总裁 Armand Ruiz、 IBM watsonx.ai 产品经理 Nisarg Patel


IBM 日前宣布,DeepSeek-R1 的 Llama 3.1 8B 和 Llama 3.3 70b 蒸馏版本现已在 IBM 的企业级 AI 开发平台 watsonx.ai 上提供


DeepSeek-R1 在 MIT 许可证下发布,主要是通过在基础模型 DeepSeek-V3 上直接使用强化学习 (RL) 开发的,这是微调 LLM 的一项重大创新。


此外,DeepSeek 还使用了一种称为知识蒸馏的技术,使用较大的 R1 模型生成的数据来微调多个 Llama 和 Qwen 模型。用户可以通过两种方式在 watsonx.ai 上访问 DeepSeek 蒸馏模型:


  • IBM 通过 “按需部署目录”在 watsonx.ai 中提供两种 Llama 蒸馏变体,允许用户部署专用实例进行安全推理。

  • 用户还可以使用自定义基础模型导入功能导入 DeepSeek-R1 模型的其他变体,如 Qwen 蒸馏模型。

DeepSeek-R1 支持哪些类型的用例?


DeepSeek-R1 以其卓越的推理能力而著称,支持各行各业的广泛应用:

  • 规划:DeepSeek-R1 专注于思维逻辑链,能够执行需要逐步推理的任务,因此非常适合为智能体

  • (代理)应用程序提供支持。

  • 编码: DeepSeek-R1 擅长编码任务,提供代码生成、调试辅助和优化建议。

  • 数学问题解决: 该模型强大的推理能力使其善于解决复杂的数学问题,这对学术研究、工程和科学计算大有裨益。


开发人员可在 IBM watsonx.ai 中使用 DeepSeek-R1 等已部署的模型和解决方案功能构建人工智能解决方案:

  • 以易于理解的格式和用户界面测试和评估模型输出

  • 通过连接各种向量数据库和嵌入模型来构建 RAG 管道

  • 与 LangChain、CrewAI 等流行框架和连接器协同工作

为何要在 watsonx.ai 上使用 DeepSeek 蒸馏模型?


IBM watsonx.ai 使客户能够定制实施 DeepSeek-R1 等开源模型,从部署环境的完全灵活性到智能体(代理)开发、微调、RAG、提示工程和与企业应用程序集成的直观工作流,用户可以利用 watsonx.ai 的内置护栏来保护他们的应用程序


当然,数据安全和 AI 治理是客户最关心的问题。除防护栏外,在 watsonx.ai 上部署时,这些模型将成为专用实例,这意味着除平台外,不会在其他任何地方共享数据。此外,与 IBM watsonx.governance 这一功能强大的治理、风险和合规性(GRC)工具包的无缝集成,可确保客户的 AI 在整个 AI 生命周期内都是负责任、透明和可解释的。

开始在 IBM watsonx.ai 上使用 DeepSeek


支持 DeepSeek-R1 的蒸馏变体是 IBM 致力于 AI 开源创新的一部分。DeepSeek Llama 的两个蒸馏模型都已纳入 IBM watsonx.ai 上按需部署目录,能够在专用 GPU 上按小时部署。

如何从 watsonx 资源中心按需部署 R1 模型


从资源中心按需部署基础模型,需要完成以下步骤:


1.   从导航菜单打开资源中心。

2.   从 “按小时付费 ”部分,找到要按需部署的 DeepSeek 模型。

3.  从模型详细信息页面,单击 “Deploy(部署)”

4.   从基础模型磁贴中单击 “Deploy(部署)”,然后选择要部署基础模型的部署空间。

5.   单击“Create(创建)”。

6.   通过 Prompt Lab 或 API/SDK 开始使用模型。


IBM watsonx.ai 在这里会用斜体显示模型的思维过程,而最终输出则用非斜体显示。只需一个简单的提示,模型就能推理并规划出响应中需要包含的各个部分。

如何通过 REST API 在 watsonx 上部署 R1 模型


此外,用户也可以使用 REST API 来部署模型


当然,前提是必须将 bearer tokenspace-id 等信息替换为相应的凭证。模型部署完成后,用户可以从 Prompt Lab 或 watsonx.ai API 提示基础模型。


通过让用户访问 watsonx.ai 上同类最优的开源模型(包括第三方模型和 IBM Granite),我们以期能够塑造协作和知识共享的文化。


点击链接即可试用watsonx.ai™中的DeepSeek-R1精馏模型

2025-02-11 14:149647

评论

发布
暂无评论

CampusBulider(模模搭)学习笔记5:创建自定义建筑

ThingJS数字孪生引擎

大前端 可视化 3D 3D可视化 数字孪生

anyRTC 六周年 打造全网最低音视频价格

anyRTC开发者

音视频 WebRTC RTC sdk

HuskyLens人工智能摄像头

不脱发的程序猿

人工智能 智能硬件 AIOT HuskyLens 人工智能摄像头

揭秘 Amazon Go 无人商店是如何炼成的!

亚马逊云科技 (Amazon Web Services)

限流与Guava RateLimiter原理解析

千珏

Java 微服务 限流算法 Guava 令牌桶

智慧党建三维云展厅可视化

一只数据鲸鱼

数据可视化 智慧党建 三维可视化

将自媒体玩得风生水起的不一定是前总统,还有可能是艺术家

zhoo299

艺术 自媒体 5月日更

编程思考路径2条

顿晓

5月日更 思考路径

Nginx负载均衡配置误区

运维研习社

nginx 负载均衡 5月日更

iMazing比iTunes好用在哪些地方

懒得勤快

网络协议之HTTP:HTTP 1.1与HTTP 2

程序员架构进阶

HTTP2.0 28天写作 HTTP协议 5月日更

Gradle学习笔记

ES_her0

5月日更

NumPy之:理解广播

程序那些事

Python Numpy 程序那些事

Amazon Glue 版本 2.0 将作业启动时间缩短了 10 倍,现已全面开放!

亚马逊云科技 (Amazon Web Services)

Amazon Route 53 Resolver 落地中国区,轻松玩转私有域名互访不是梦!| 新服务上线

亚马逊云科技 (Amazon Web Services)

STM32电源框图解析(VDD、VSS、VDDA、VSSA、VREF+、VREF-、VBAT等的区别)

不脱发的程序猿

嵌入式 stm32 单片机 电源框图解析

嵌入式程序调用函数的内部过程和机制

不脱发的程序猿

单片机 嵌入式程序 嵌入式设计

再学习一个 Golang 专栏

escray

学习 极客时间 Go 语言 5月日更

学习笔记:02 | 第一个程序:教你输出彩色的文字

Nydia

学习

【LeetCode】子数组异或查询Java题解

Albert

算法 LeetCode 5月日更

“云演唱会”也有仪式感!能检票、可转赠,爱奇艺“云票”如何重构线上购票逻辑

爱奇艺技术产品团队

如何高效地存储与检索大规模的图谱数据?

华为云开发者联盟

存储 知识图谱 检索 图结构 表结构

怎么进大厂?166位Java工程师的大厂面试经验分享

北游学Java

Java 面试 大厂

人证一体机产品设计

lenka

5月日更

Windows自带的功能这么好用,还装什么第三方软件?

彭宏豪95

windows 5月日更

流量变现业务概论——Linkedmall流量变现业务初步分析及系统设计概要

关贺宇

关于组件,你真的了解么?

架构精进之路

组件化 5月日更

你认识镜子里的那个自己吗?

小天同学

原则 认知 5月日更

Ansible AD-Hoc

耳东@Erdong

ansible 5月日更

华为云PB级数据库GaussDB(for Redis)揭秘第十期:GaussDB(for Redis)迁移系列(上)

华为云开发者联盟

数据仓库 华为云 数据迁移 GaussDB(for Redis) PB级数据库

源码解析之Seata项目中的分布式ID生成算法

Coder的技术之路

分布式 分布式ID

IBM在watsonx.ai 上提供DeepSeek R1 蒸馏模型_AI&大模型_InfoQ精选文章