写点什么

微软、AWS 后,英伟达也已接入 DeepSeek,扎克伯格:我们将“偷师”DeepSeek

  • 2025-02-01
    北京
  • 本文字数:831 字

    阅读完需:约 3 分钟

大小:434.68K时长:02:28
微软、AWS后,英伟达也已接入DeepSeek,扎克伯格:我们将“偷师”DeepSeek

新春伊始,DeepSeek 凭借其极有竞争性的价格优势和精准的算法火遍了硅谷和华尔街。与此同时,各大科技巨头也迅速行动,纷纷下场无缝接入 DeepSeek 的 R1 模型服务,以期抢占 AI 领域先机。

 

在最先出手的是微软。美国当地时间 1 月 29 日,微软宣布 DeepSeek R1 已在 Azure AI Foundry 和 GitHub 上提供,开发者可以用新模型进行测试和构建基于云的应用程序和服务。微软客户能够使用 DeepSeek R1 模型的精简版本在其 Copilot+ PC 上本地运行。



尽管微软是 OpenAI 的重要投资者并与其有着广泛的合作,但在推进产品商业化方面,它仍倾向于采用多元化的模型策略。现今,Azure 平台上不仅涵盖了 OpenAI 的 GPT 系列、Meta 的 Llama 系列以及 Mistral 的模型,还最新引入了 DeepSeek。


 

随后,AWS 也宣布用户可以在 Amazon Bedrock 和 Amazon SageMaker AI 两大 AI 服务平台上部署 DeepSeek-R1 模型。


 

时隔一天,英伟达也宣布接入 DeepSeek R1 模型。英伟达在官网上称:“为了帮助开发者安全地试验这些功能并构建自己的专用代理,6710 亿参数的 DeepSeek-R1 模型现已作为 NVIDIA NIM 微服务预览版在build.nvidia.com上提供。DeepSeek-R1 NIM 微服务可以在单个英伟达 HGX H200 系统上每秒最多处理 3872 个 token。”



开发人员可以使用应用程序编程接口 (API) 进行测试和试验,该接口预计很快将作为英伟达 AI Enterprise 软件平台的一部分,以可下载的 NIM 微服务形式推出。

 

Meta CEO 扎克伯格也“蹭了蹭”DeepSeek 的泼天流量。在周三在与分析师的电话会议上,扎克伯格讨论了 DeepSeek。

 

扎克伯格表示,Meta 仍在消化 DeepSeek 的一些成果,他的团队希望最终将其中一些进步应用到他们自己的 AI 项目中。他强调 Meta 将继续学习 DeepSeek 等技术,并发布自己的开源免费 Llama AI 模型,这也能推动行业发展。

 

“我仍然认为,从长远来看,大力投资资本支出和基础设施将是一种战略优势,”扎克伯格说道。“我们可能在某个时候会发现其他情况,但我认为现在下结论还为时过早,就目前而言,我敢打赌,建设这种基础设施的能力将是一个重大优势。”

2025-02-01 08:4914631
用户头像
李冬梅 加V:busulishang4668

发布了 1223 篇内容, 共 837.6 次阅读, 收获喜欢 1316 次。

关注

评论

发布
暂无评论

打破固有思维(十九)

Changing Lin

Django 之路由篇

若尘

django Python编程 路由 5月日更

阿里P9架构师力荐:Java面试必刷的17套一线大厂真题(含答案)

Java架构追梦

Java 阿里巴巴 架构 腾讯 面试

农产品区块链溯源平台建设解决方案,健全食品安全体系

源中瑞-龙先生

区块链 溯源 食品安全

不同数据库模式下DATE类型的行为解析

华为云开发者联盟

MySQL oracle GaussDB(DWS) TD DATE类型

硬核出击,只为守护你的秘密!

亚马逊云科技 (Amazon Web Services)

提高建模效率:自动化机器学习之贝叶斯优化综述

索信达控股

机器学习 自动化 金融科技 贝叶斯公式 产品建模

NUCLEO-L432KC实现ADC配置(STM32L432KC)

不脱发的程序猿

嵌入式 单片机 NUCLEO-L432KC STM32L432KC 光敏电阻传感器

强劲性能释放释放:联想消费新品笔记本震撼发布

E科讯

工业绿色发展可视化管理——高炉炼铁厂可视化系统

一只数据鲸鱼

数据可视化 工业物联网 智慧工厂 三维可视化 高炉炼铁

将模型转为NNIE框架支持的wk模型第一步:tensorflow->caffe

华为云开发者联盟

tensorflow caffe NNIE框架 wk模型 mxnet

hive的DDL语法基本操作

大数据技术指南

hive 5月日更

阿里云黄博远:AI工程化是发挥算法及数据价值的效能中枢

阿里云大数据AI技术

iOS 面试策略之经验之谈-架构的选择

iOSer

ios 架构

GitHub上下载量突破100000+阿里巴巴的这份开源项目如此牛逼

阿里巴巴 开源 编程 Java 25 周年

“零信任产业标准工作组”再度升级,持续促进国内零信任产业的协同发展

iOS 面试策略之经验之谈-面向协议的编程

iOSer

ios swift 面试 面向协议protocol编程 面向协议编程

iOS 面试策略之经验之谈- App的测试和上架

iOSer

ios 面试 app上架 app测试

助力秋招第二弹:Java并发编程知识梳理

北游学Java

Java 面试 秋招

一文通关苦涩难懂的Java泛型

程序猿阿星

泛型 java基础 Java泛型

iOS面试大全从面试的准备和流程到算法和数据结构以及计算机基础知识

iOSer

ios 面试 面向协议protocol编程 iOS 知识体系

打造生态“朋友圈”,英特尔以生态之道培育AI创新“大气候”

E科讯

SUSECON 2021首日重点新闻:SLES 15 SP3和SUSE Rancher 2.6全新发布

Rancher

Flutter 混合开发基础

网易云信

flutter 框架

看德威学校如何通过亚马逊云科技开启青少年AI探索之旅

亚马逊云科技 (Amazon Web Services)

太为难我了,阿里面试了7轮(5年经验,拿下P7岗offer)

Java 程序员 架构 面试

膜拜!多次霸榜Github的springboot 实战派文档到底有多强?

Java 程序员 架构 面试

Docgeni,开箱即用的 Angular 组件文档工具

PingCode研发中心

开源 研发工具

直播点播窄带高清之 JND 感知编码技术

网易云信

音视频 视频编码

微软、AWS后,英伟达也已接入DeepSeek,扎克伯格:我们将“偷师”DeepSeek_英伟达_李冬梅_InfoQ精选文章