写点什么

IBM 在 watsonx.ai 上提供 DeepSeek R1 蒸馏模型

IBM

  • 2025-02-11
    北京
  • 本文字数:1508 字

    阅读完需:约 5 分钟

IBM在watsonx.ai 上提供DeepSeek R1 蒸馏模型

作者:IBM watsonx.ai 产品主管 Maryam Ashoori、IBM AI 平台(watsonx.ai 和 watsonx.governance)产品管理副总裁 Armand Ruiz、 IBM watsonx.ai 产品经理 Nisarg Patel


IBM 日前宣布,DeepSeek-R1 的 Llama 3.1 8B 和 Llama 3.3 70b 蒸馏版本现已在 IBM 的企业级 AI 开发平台 watsonx.ai 上提供


DeepSeek-R1 在 MIT 许可证下发布,主要是通过在基础模型 DeepSeek-V3 上直接使用强化学习 (RL) 开发的,这是微调 LLM 的一项重大创新。


此外,DeepSeek 还使用了一种称为知识蒸馏的技术,使用较大的 R1 模型生成的数据来微调多个 Llama 和 Qwen 模型。用户可以通过两种方式在 watsonx.ai 上访问 DeepSeek 蒸馏模型:


  • IBM 通过 “按需部署目录”在 watsonx.ai 中提供两种 Llama 蒸馏变体,允许用户部署专用实例进行安全推理。

  • 用户还可以使用自定义基础模型导入功能导入 DeepSeek-R1 模型的其他变体,如 Qwen 蒸馏模型。

DeepSeek-R1 支持哪些类型的用例?


DeepSeek-R1 以其卓越的推理能力而著称,支持各行各业的广泛应用:

  • 规划:DeepSeek-R1 专注于思维逻辑链,能够执行需要逐步推理的任务,因此非常适合为智能体

  • (代理)应用程序提供支持。

  • 编码: DeepSeek-R1 擅长编码任务,提供代码生成、调试辅助和优化建议。

  • 数学问题解决: 该模型强大的推理能力使其善于解决复杂的数学问题,这对学术研究、工程和科学计算大有裨益。


开发人员可在 IBM watsonx.ai 中使用 DeepSeek-R1 等已部署的模型和解决方案功能构建人工智能解决方案:

  • 以易于理解的格式和用户界面测试和评估模型输出

  • 通过连接各种向量数据库和嵌入模型来构建 RAG 管道

  • 与 LangChain、CrewAI 等流行框架和连接器协同工作

为何要在 watsonx.ai 上使用 DeepSeek 蒸馏模型?


IBM watsonx.ai 使客户能够定制实施 DeepSeek-R1 等开源模型,从部署环境的完全灵活性到智能体(代理)开发、微调、RAG、提示工程和与企业应用程序集成的直观工作流,用户可以利用 watsonx.ai 的内置护栏来保护他们的应用程序


当然,数据安全和 AI 治理是客户最关心的问题。除防护栏外,在 watsonx.ai 上部署时,这些模型将成为专用实例,这意味着除平台外,不会在其他任何地方共享数据。此外,与 IBM watsonx.governance 这一功能强大的治理、风险和合规性(GRC)工具包的无缝集成,可确保客户的 AI 在整个 AI 生命周期内都是负责任、透明和可解释的。

开始在 IBM watsonx.ai 上使用 DeepSeek


支持 DeepSeek-R1 的蒸馏变体是 IBM 致力于 AI 开源创新的一部分。DeepSeek Llama 的两个蒸馏模型都已纳入 IBM watsonx.ai 上按需部署目录,能够在专用 GPU 上按小时部署。

如何从 watsonx 资源中心按需部署 R1 模型


从资源中心按需部署基础模型,需要完成以下步骤:


1.   从导航菜单打开资源中心。

2.   从 “按小时付费 ”部分,找到要按需部署的 DeepSeek 模型。

3.  从模型详细信息页面,单击 “Deploy(部署)”

4.   从基础模型磁贴中单击 “Deploy(部署)”,然后选择要部署基础模型的部署空间。

5.   单击“Create(创建)”。

6.   通过 Prompt Lab 或 API/SDK 开始使用模型。


IBM watsonx.ai 在这里会用斜体显示模型的思维过程,而最终输出则用非斜体显示。只需一个简单的提示,模型就能推理并规划出响应中需要包含的各个部分。

如何通过 REST API 在 watsonx 上部署 R1 模型


此外,用户也可以使用 REST API 来部署模型


当然,前提是必须将 bearer tokenspace-id 等信息替换为相应的凭证。模型部署完成后,用户可以从 Prompt Lab 或 watsonx.ai API 提示基础模型。


通过让用户访问 watsonx.ai 上同类最优的开源模型(包括第三方模型和 IBM Granite),我们以期能够塑造协作和知识共享的文化。


点击链接即可试用watsonx.ai™中的DeepSeek-R1精馏模型

2025-02-11 14:149596

评论

发布
暂无评论

滴滴DoKit阶段性成果汇报之一机多控

工具 滴滴开源 DoKit

自从看了百度强推的“Spring源码笔记”我从渣渣成功逆袭成为钢铁侠!

比伯

Java 架构 程序人生 计算机 spring源码

原创 | 使用JPA实现DDD持久化-启动JPA程序+通过JPA原生API访问数据

编程道与术

Java hibernate 编程 mybatis jpa

架构师训练营第 1 期 -week13

习习

朱嘉明:产业周期、科技周期与金融周期的失衡

CECBC

金融 科技

Mysql中,1=1和 1=1=1 和 -1=-1 和 -1=-1=-1 和 5=5 和 5=5=5 有什么区别

Geek_de9857

MySQL sql 返回值 1=1=1 -1=1=1

一文详解激活函数

书豪

佛萨奇Forsage系统开发,智能合约dapp技术

薇電13242772558

智能合约 dapp

15年华为云视频架构师采访实录:揭秘未来音视频行业的科技趋势!

华为云开发者联盟

直播 视频 华为云

终于有人把性能优化讲清楚了!阿里架构师推荐的Java性能权威指南可太强了

Java架构之路

Java 程序员 架构 面试 编程语言

原创 | 使用JPA实现DDD持久化-通过Spring Data JPA访问数据

编程道与术

Java hibernate 编程 mybatis jpa

原创 | 使用JPA实现DDD持久化-O/R映射元数据-值属性映射

编程道与术

Java hibernate 编程 mybatis jpa

去 DeepMind 面试是怎样一种体验?

故胤道长

人工智能 面试 谷歌Google 硅谷 移动开发

第九周学习总结

Griffenliu

架构师训练营 1 期 -- 第十三周作业

曾彪彪

极客大学架构师训练营

基于区块链的政务平台设计探索

华为云开发者联盟

区块链 架构 安全

架构师训练营第四周命题作业

Geek_xq

【涂鸦物联网足迹】用煲仔饭来说明IaaS/PaaS/SaaS的区别

IoT云工坊

云计算 IaaS PaaS SaaS 云平台

JavaScript中,if判断未生效的一些特殊情况

Geek_de9857

js 1 if 0 不生效

原创 | 使用JPA实现DDD持久化-O/R映射元数据-值和关联的比较+继承映射

编程道与术

Java hibernate 编程 mybatis jpa

阿里Java岗面试必备JVM指南:内存分配+垃圾回收+调优+类加载器等

Java架构之路

Java 程序员 架构 面试 编程语言

一周信创舆情观察(12.7~12.13)

统小信uos

阿里云容器服务入选云原生边缘「领导力企业TOP3」,推动「原生云边」基础设施标准建立

阿里巴巴云原生

阿里云 容器 开发者 云原生 边缘计算

eCharts -- 如何修改柱状图中相关数据的顺序?如何在鼠标悬浮时增加百分比信息?如何为柱状图设置分组?

Geek_de9857

柱状图 eCharts 修改数据顺序 百分比提示信息 设置分组

Java程序员还没有掌握SpringBoot?这一份文档你真应该好好学学!

Java架构之路

Java 程序员 架构 面试 编程语言

原创 | 使用JPA实现DDD持久化-O/R映射元数据-关联属性映射

编程道与术

Java hibernate 编程 mybatis jpa

第九周作业

Griffenliu

阿里Java研发第2面,都会问什么?斩获阿里P6+的“他”告诉你答案

Java架构之路

Java 程序员 架构 面试 编程语言

盘点 2020 | 感悟总结

idonkeyliu

盘点2020

Hive中,同时存在map、array、struct这三种格式,应如何在建表语句中指定分隔符?

Geek_de9857

hive struct map array 分隔符

读《全球创新投资:经济大变局中的财富新机遇》

邓瑞恒Ryan

创业 读书笔记 企业 企业管理 产业竞争

IBM在watsonx.ai 上提供DeepSeek R1 蒸馏模型_AI&大模型_InfoQ精选文章