写点什么

微软、AWS 后,英伟达也已接入 DeepSeek,扎克伯格:我们将“偷师”DeepSeek

  • 2025-02-01
    北京
  • 本文字数:831 字

    阅读完需:约 3 分钟

大小:434.68K时长:02:28
微软、AWS后,英伟达也已接入DeepSeek,扎克伯格:我们将“偷师”DeepSeek

新春伊始,DeepSeek 凭借其极有竞争性的价格优势和精准的算法火遍了硅谷和华尔街。与此同时,各大科技巨头也迅速行动,纷纷下场无缝接入 DeepSeek 的 R1 模型服务,以期抢占 AI 领域先机。

 

在最先出手的是微软。美国当地时间 1 月 29 日,微软宣布 DeepSeek R1 已在 Azure AI Foundry 和 GitHub 上提供,开发者可以用新模型进行测试和构建基于云的应用程序和服务。微软客户能够使用 DeepSeek R1 模型的精简版本在其 Copilot+ PC 上本地运行。



尽管微软是 OpenAI 的重要投资者并与其有着广泛的合作,但在推进产品商业化方面,它仍倾向于采用多元化的模型策略。现今,Azure 平台上不仅涵盖了 OpenAI 的 GPT 系列、Meta 的 Llama 系列以及 Mistral 的模型,还最新引入了 DeepSeek。


 

随后,AWS 也宣布用户可以在 Amazon Bedrock 和 Amazon SageMaker AI 两大 AI 服务平台上部署 DeepSeek-R1 模型。


 

时隔一天,英伟达也宣布接入 DeepSeek R1 模型。英伟达在官网上称:“为了帮助开发者安全地试验这些功能并构建自己的专用代理,6710 亿参数的 DeepSeek-R1 模型现已作为 NVIDIA NIM 微服务预览版在build.nvidia.com上提供。DeepSeek-R1 NIM 微服务可以在单个英伟达 HGX H200 系统上每秒最多处理 3872 个 token。”



开发人员可以使用应用程序编程接口 (API) 进行测试和试验,该接口预计很快将作为英伟达 AI Enterprise 软件平台的一部分,以可下载的 NIM 微服务形式推出。

 

Meta CEO 扎克伯格也“蹭了蹭”DeepSeek 的泼天流量。在周三在与分析师的电话会议上,扎克伯格讨论了 DeepSeek。

 

扎克伯格表示,Meta 仍在消化 DeepSeek 的一些成果,他的团队希望最终将其中一些进步应用到他们自己的 AI 项目中。他强调 Meta 将继续学习 DeepSeek 等技术,并发布自己的开源免费 Llama AI 模型,这也能推动行业发展。

 

“我仍然认为,从长远来看,大力投资资本支出和基础设施将是一种战略优势,”扎克伯格说道。“我们可能在某个时候会发现其他情况,但我认为现在下结论还为时过早,就目前而言,我敢打赌,建设这种基础设施的能力将是一个重大优势。”

2025-02-01 08:4914660
用户头像
李冬梅 加V:busulishang4668

发布了 1231 篇内容, 共 848.4 次阅读, 收获喜欢 1323 次。

关注

评论

发布
暂无评论

从零开始构建AI Agent评估体系:12种LangSmith评估方法详解

郝培强

Java 王者修炼手册【集合篇-HashMap】:HashMap 核心技能 + HashSet 搭档机制全拆解

DonaldCen

HashMap底层原理 HashSet HashMap扩容机制

Java 王者修炼手册【并发篇-并发基础】:从线程状态到同步机制的底层修炼

DonaldCen

线程安全 线程状态 线程协作

Java 王者修炼手册【Mysql篇 - SQL执行存储流程】:拆解 InnoDB 存储结构与 SQL 执行流程,吃透 Buffer Pool 和 Change Buffer 核心原理

DonaldCen

Buffer Pool 数据存储机制 Change Buffer SQL 各子句的执行顺序

Java 王者修炼手册【MyBatis 篇 - 底层依赖】:吃透 JDBC/MyBatis 核心接口类,掌控全链路整合逻辑

DonaldCen

connection SqlSessionTemplate BoundSql PreparedStatement

区块链 Web3 外包开发上线流程

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

5连“A” | 彩讯股份连续5年获深交所信息披露最高等级评价

彩讯股份300634

AIGUI八要素驱动DingOS实现感知-生成-进化的闭环

鼎道智联

AIGC

Java 王者修炼手册【集合篇-ConcurrentHashMap】 :从分段锁到桶级锁的锁系进化

DonaldCen

ConcurrentHashMap 并发

Java 王者修炼手册【JVM篇 - 底层原理】:从类加载到 JVM 调优与 OOM 诊断修炼

DonaldCen

JVM GC算法 双亲委派模型 垃圾回收器

Java 王者修炼手册【Mysql 篇 - 锁】:吃透 MySQL 行锁 + 间隙锁 + 意向锁 底层机制,了解死锁解决方案

DonaldCen

死锁 间隙锁 意向锁 行锁

Java 王者修炼手册【Mysql 篇 - 大表操作】:千万级大表核心操作原理与实战方案

DonaldCen

数据模型与操作 大表删除字段 大表清除数据 大表新增字段

ava 王者修炼手册【Mysql 篇 - 事务】:吃透 ACID 本质 + 隔离级别底层 + 大事务排查优化方案,掌控事务核心逻辑

DonaldCen

ACID 实现原理 隔离级别底层机制 大事务识别优化

BeeWorks Meet:一款支持私有化内网使用的视频会议软件

BeeWorks

即时通讯 IM 私有化部署

Java 王者修炼手册【基础篇-异常机制】:Java异常的底层逻辑

DonaldCen

异常底层原理 深入理解异常 异常表 异常最佳实践

Java 王者修炼手册【基础篇-反射机制】:反射让底层操控力直接拉满!

DonaldCen

Class类用法 Constructor类用法 Field用法 Method用法

Java 王者修炼手册【并发篇 - 并发工具】:从 AQS到线程池修炼

DonaldCen

AQS ReentrantLock Condition LockSupport 同步工具

Java王者修炼手册【Spring 篇 - Bean核心原理】:从 Bean 定义注册到动态代理全链路修炼

DonaldCen

bean FactoryBean JDK 动态代理 CGLIB 动态代理 ObjectFactory

Java 王者修炼手册【Spring 篇 - 循环依赖 & 三级缓存】:Bean创建流程 + 循环依赖 + 三级缓存原理 大揭秘

DonaldCen

循环依赖 三级缓存 Bean创建流程

AI创作革命:KoalaQA如何用智能问答重塑企业知识生产

百川云开发者

Java 王者修炼手册【基础篇-泛型机制】:从底层原理到实战应用,核心知识点与面试考点全涵盖

DonaldCen

泛型 java基础 类型擦除

千万 QPS 下的 DNS 治理:从“够用”到“可控”

柯杰

架构 后端 网络

区块链 Web3 外包开发测试流程

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

CAD怎么添加打印文件PC5

极客天地

隐语嘉年华|这一次,我们聊聊数据如何真正“连”起来

隐语SecretFlow

ava 王者修炼手册【Spring 篇 - AOP 与事务】:底层原理 + 实战避坑全攻略

DonaldCen

AOP 核心 AOP 底层流程 AOP失效场景 Spring 事务

Java 王者修炼手册【Mysql篇 - 索引+ SQL优化】:拆解 索引 + 执行计划 + SQL优化 核心原理

DonaldCen

B+树 覆盖索引 索引下推 索引合并 索引失效场景

从训练到推理:Intel Extension for PyTorch混合精度优化完整指南

郝培强

Java 王者修炼手册【集合篇-ArrayList】:从ArrayList数据结构到避坑指南

DonaldCen

线程安全 ArrayList linkedlist 扩容机制

Java 王者修炼手册【Mysql 篇 - 日志】:吃透 MySQL redo log + undo log + binlog 底层机制

DonaldCen

Binlog Redo Log Undo Log 两阶段提交 WAL核心原理

区块链 NFT 系统开发费用

北京木奇移动技术有限公司

区块链开发 软件外包公司 web3开发

微软、AWS后,英伟达也已接入DeepSeek,扎克伯格:我们将“偷师”DeepSeek_英伟达_李冬梅_InfoQ精选文章