写点什么

IBM 在 watsonx.ai 上提供 DeepSeek R1 蒸馏模型

IBM

  • 2025-02-11
    北京
  • 本文字数:1508 字

    阅读完需:约 5 分钟

IBM在watsonx.ai 上提供DeepSeek R1 蒸馏模型

作者:IBM watsonx.ai 产品主管 Maryam Ashoori、IBM AI 平台(watsonx.ai 和 watsonx.governance)产品管理副总裁 Armand Ruiz、 IBM watsonx.ai 产品经理 Nisarg Patel


IBM 日前宣布,DeepSeek-R1 的 Llama 3.1 8B 和 Llama 3.3 70b 蒸馏版本现已在 IBM 的企业级 AI 开发平台 watsonx.ai 上提供


DeepSeek-R1 在 MIT 许可证下发布,主要是通过在基础模型 DeepSeek-V3 上直接使用强化学习 (RL) 开发的,这是微调 LLM 的一项重大创新。


此外,DeepSeek 还使用了一种称为知识蒸馏的技术,使用较大的 R1 模型生成的数据来微调多个 Llama 和 Qwen 模型。用户可以通过两种方式在 watsonx.ai 上访问 DeepSeek 蒸馏模型:


  • IBM 通过 “按需部署目录”在 watsonx.ai 中提供两种 Llama 蒸馏变体,允许用户部署专用实例进行安全推理。

  • 用户还可以使用自定义基础模型导入功能导入 DeepSeek-R1 模型的其他变体,如 Qwen 蒸馏模型。

DeepSeek-R1 支持哪些类型的用例?


DeepSeek-R1 以其卓越的推理能力而著称,支持各行各业的广泛应用:

  • 规划:DeepSeek-R1 专注于思维逻辑链,能够执行需要逐步推理的任务,因此非常适合为智能体

  • (代理)应用程序提供支持。

  • 编码: DeepSeek-R1 擅长编码任务,提供代码生成、调试辅助和优化建议。

  • 数学问题解决: 该模型强大的推理能力使其善于解决复杂的数学问题,这对学术研究、工程和科学计算大有裨益。


开发人员可在 IBM watsonx.ai 中使用 DeepSeek-R1 等已部署的模型和解决方案功能构建人工智能解决方案:

  • 以易于理解的格式和用户界面测试和评估模型输出

  • 通过连接各种向量数据库和嵌入模型来构建 RAG 管道

  • 与 LangChain、CrewAI 等流行框架和连接器协同工作

为何要在 watsonx.ai 上使用 DeepSeek 蒸馏模型?


IBM watsonx.ai 使客户能够定制实施 DeepSeek-R1 等开源模型,从部署环境的完全灵活性到智能体(代理)开发、微调、RAG、提示工程和与企业应用程序集成的直观工作流,用户可以利用 watsonx.ai 的内置护栏来保护他们的应用程序


当然,数据安全和 AI 治理是客户最关心的问题。除防护栏外,在 watsonx.ai 上部署时,这些模型将成为专用实例,这意味着除平台外,不会在其他任何地方共享数据。此外,与 IBM watsonx.governance 这一功能强大的治理、风险和合规性(GRC)工具包的无缝集成,可确保客户的 AI 在整个 AI 生命周期内都是负责任、透明和可解释的。

开始在 IBM watsonx.ai 上使用 DeepSeek


支持 DeepSeek-R1 的蒸馏变体是 IBM 致力于 AI 开源创新的一部分。DeepSeek Llama 的两个蒸馏模型都已纳入 IBM watsonx.ai 上按需部署目录,能够在专用 GPU 上按小时部署。

如何从 watsonx 资源中心按需部署 R1 模型


从资源中心按需部署基础模型,需要完成以下步骤:


1.   从导航菜单打开资源中心。

2.   从 “按小时付费 ”部分,找到要按需部署的 DeepSeek 模型。

3.  从模型详细信息页面,单击 “Deploy(部署)”

4.   从基础模型磁贴中单击 “Deploy(部署)”,然后选择要部署基础模型的部署空间。

5.   单击“Create(创建)”。

6.   通过 Prompt Lab 或 API/SDK 开始使用模型。


IBM watsonx.ai 在这里会用斜体显示模型的思维过程,而最终输出则用非斜体显示。只需一个简单的提示,模型就能推理并规划出响应中需要包含的各个部分。

如何通过 REST API 在 watsonx 上部署 R1 模型


此外,用户也可以使用 REST API 来部署模型


当然,前提是必须将 bearer tokenspace-id 等信息替换为相应的凭证。模型部署完成后,用户可以从 Prompt Lab 或 watsonx.ai API 提示基础模型。


通过让用户访问 watsonx.ai 上同类最优的开源模型(包括第三方模型和 IBM Granite),我们以期能够塑造协作和知识共享的文化。


点击链接即可试用watsonx.ai™中的DeepSeek-R1精馏模型

2025-02-11 14:149512

评论

发布
暂无评论

三天入门 Docker 系列

爱好编程进阶

程序员 后端开发

你一定需要知道的高阶JAVA枚举特性!

爱好编程进阶

Java 程序员 后端开发

从AI数羊到“相牛”:人工智能应用如何低门槛化?

脑极体

Java进阶备战金九银十88道真题:多线程+集合

爱好编程进阶

Java 程序员 后端开发

Shiro 权限管理入门之认证与授权

爱好编程进阶

Java 程序员 后端开发

[Java基础]Map集合的遍历

爱好编程进阶

Java 程序员 后端开发

Java 集合看这一篇就够了

爱好编程进阶

程序员 后端开发

[JVM面试]Full GC 到底是如何产生的?如何解决?

爱好编程进阶

Java 程序员 后端开发

【万字长文】吃透负载均衡

爱好编程进阶

Java 程序员 后端开发

事务特征以及隔离级别

爱好编程进阶

Java 程序员 后端开发

Kubernetes下web服务的性能测试三部曲之一:准备工作

程序员欣宸

Java Kubernetes 5月月更

再议String-字符串常量池与String

爱好编程进阶

程序员 后端开发

15-操作DOM对象

爱好编程进阶

Java 程序员 后端开发

mykit-lock之——分布式锁插件正式开源

爱好编程进阶

Java 程序员 后端开发

redis编码及数据结构

爱好编程进阶

Java 程序员 后端开发

中国古代经典励志名言100句,百读不厌,陪孩子一起读经典

爱好编程进阶

Java 程序员 后端开发

ElasticSearch 概述

爱好编程进阶

Java 程序员 后端开发

LeetCode - 1629 -按键持续时间最长的键 - Java - 细喔

爱好编程进阶

Java 程序员 后端开发

Linux宝塔面板命令大全

爱好编程进阶

Java 程序员 后端开发

SpringFramework中的注解声明式事务怎么被Shiro搞失效了

爱好编程进阶

Java 程序员 后端开发

Mybatis源码学习(二)缓存和别名处理器

爱好编程进阶

程序员 后端开发

Tomcat,Let‘s Go!

爱好编程进阶

程序员 后端开发

IntelliJ IDEA如何clean或者install Maven项目

爱好编程进阶

程序员 后端开发

JDBC访问数据库的一些小技巧

爱好编程进阶

程序员 后端开发

SpringCloud Alibaba实战二十七 - Oauth2认证服务器自定义异常

爱好编程进阶

Java 程序员 后端开发

Java字节流和字符流,是时候总结一下IO流了

爱好编程进阶

程序员 后端开发

KMP子字符串匹配算法学习笔记

爱好编程进阶

Java 程序员 后端开发

k8s client-go源码分析 informer源码分析(3)-Reflector源码分析

良凯尔

容器 云原生 Kubernetes 集群 Client-go

网站开发进阶(六十四)CSS 属性选择器讲解

No Silver Bullet

CSS 属性选择器 5月月更

5分钟学会 Vim 分屏操作方方面面

爱好编程进阶

Java 程序员 后端开发

【Java】升级版学生管理系统项目

爱好编程进阶

Java 程序员 后端开发

IBM在watsonx.ai 上提供DeepSeek R1 蒸馏模型_AI&大模型_InfoQ精选文章