生成式AI领域的最新成果都在这里!抢 QCon 展区门票 了解详情
写点什么

欧洲版 OpenAI 被微软收编了,但这家号称专注于“开源”的大模型企业转向了”闭源“?

  • 2024-02-27
    北京
  • 本文字数:2320 字

    阅读完需:约 8 分钟

大小:1.04M时长:06:05
欧洲版OpenAI被微软收编了,但这家号称专注于“开源”的大模型企业转向了”闭源“?

今天,微软突然宣布与法国开源大模型初创公司 Mistral 达成深度合作。

 

Mistral AI 正式成立于 2023 年 5 月,估值 20 亿欧元(约合 21 亿美元)。双方将共同开展研发合作,并将 Mistral 的 AI 模型部署在微软 Azure 云计算平台上。这将使 Mistral 成为继 OpenAI 之后,第二家在 Azure 上提供商用语言模型的公司。

 

而且,据媒体透露,作为交易的一部分,微软还将对 Mistral 进行投资。这将使其成为继 OpenAI 之后,微软投资的第二家 AI 大模型公司。具体投资金额尚未披露。此前,微软投资 OpenAI 为 130 亿美元,持有 OpenAI 约 49%股份。

 


AI 新贵 Mistral 发布最新旗舰大模型

 

Mistral AI 也于今天宣布正式推出最新旗舰模型 Mistral Large。这是一种新的语言模型,旨在与 OpenAI 的 GPT-4 直接竞争。

 

Mistral AI 声称该模型具有“顶级的推理能力”,能用于处理复杂的多语言推理任务,包括文本理解、转换和代码生成。

 

在常用基准测试 MMLU 的对比中,Mistral Large 的得分仅次于 GPT-4,略好于 Anthropic 开发的 Claude 2。至于谷歌的 Gemini Pro 以及的 LLaMA 2 70B 模型,则被甩开了一个身位。

 


在推理能力上,Mistral Large 也仅次于 GPT-4,优于 LLaMA 2 70B 模型:

 


Mistral Large 具有本地多语言能力。它在法语、德语、西班牙语和意大利语的 HellaSwag、Arc Challenge 和 MMLU 基准测试中明显优于 LLaMA 2 70B。

 


各路网友纷纷对其进行了测试,表示其能力“仅次于 OpenAI”、“中文文本处理能力无限逼近 GPT-4”......

 



Mistral AI 在发布大模型的博客中,同时宣布将他们的开放式和商业模型引入到 Azure 中。所以现在访问 Mistral AI 的模型方式为:

 

  • La Plateforme:该平台托管在 Mistral 位于欧洲的基础设施上,使开发人员能够利用 Mistral AI 全系列模型构建应用程序和服务。

  • Azure:Mistral Large 已通过 Azure AI Studio 和 Azure Machine Learning 上线,用户体验顺畅,一些测试版客户已经在使用。

  • 自部署:对于最敏感的用例,用户可以在自己的环境中部署 Mistral AI 的模型,并访问其模型权重。

 

微软表示与 Mistral 的合作将帮助 Mistral 将其 AI 模型推向市场,并用于开发满足欧洲各国政府和公共部门需求的应用程序。

 

微软总裁 Brad Smith 发言称,微软与 Mistral 的合作,将推动 AI 技术在欧洲乃至全球的应用和发展。他认为,AI 将创造全新的业务和商业模式,并将对各个行业产生深远影响。

 

这次合作,让 Mistral 成为“闭源”公司?

 

微软首席执行官萨特亚·纳德拉 (Satya Nadella) 近日称赞了法国初创公司 Mistral AI,将其视为在 Azure 云计算平台上构建人工智能的创新者之一。

 

Mistral 由三位来自 Meta 和谷歌的前研究人员 Mensch、Timothée Lacroix 和 Guillaume Lample 创立,致力于构建大语言模型,这也是生成式 AI 产品的基础技术。

 


Mistral 于去年 12 月的融资中获得了 20 亿欧元的估值,融资金额约为 4 亿欧元。

 

据英国《金融时报》,该公司承诺将模型开源,这意味着技术细节将公开发布,这与竞争对手 (例如 ChatGPT 制造商 OpenAI) 的做法形成鲜明对比。OpenAI 最新的模型 GPT-4 是所谓的 “黑匣子”,用于构建模型的数据和代码不会提供给第三方。

 

Mistral 此前也一直专注于开源 AI 软件,他们坚信生成式 AI 技术应该是开源的,允许自由复制和修改 LLM 代码,通过这种方式帮助其他用户快速构建自己的聊天机器人。Mixtral 8x7b 则被许多人视为目前性能最好的开源 LLM。

 

但因为 Mistral 没有像往常一样提供 GitHub 或是下载链接,不少网友担心这家公司开始转为“闭源”方向。

 

而且,还有网友发现,Mistral 更改了他们的网站,删除了之前提及的关于他们对开源社区义务的地方,这也让一些人认为 Mistral 已经失去了初心。

 


独立科技记者 Luca Bertuzzi 得到的消息跟《金融时报》完全相反,他发推表示,“与之前的模型不同,Mistral Large 不会开源,换句话说,Mistral 正在放弃其备受赞誉的开源方法。”

 


“他们提供的最初的信息是‘在 2024 年发布开源 GPT-4 级别模型’,现在他们的立场变了,我们不希望他们成为另一个 OpenAI。”

 


模型的定价也引发了一些质疑,比如 Mistral Small 的低延迟相比于 Mixtral 8x7B 的提升微乎其微,但输入贵了 2.8 倍,输出贵了 8.5 倍。

 

那么为什么微软选择和 Mistral 合作?

 

微软在其博客中透露,该公司与 Mistral AI 合作的一个核心方向就是“扩大市场,微软和 Mistral AI 将通过 Azure AI Studio 和 Azure 机器学习模型目录中的模型即服务 (MaaS) 、MACC 服务向客户提供 Mistral AI 的高级模型,提供可替换 OpenAI 模型的多种选择,包括开源和商用模型。”

 

微软表示,其数据中心运行着 1,600 个 AI 模型,其中 1,500 个是开源的。公司希望除了支持 OpenAI 等专有技术之外,继续在这个领域提供支持。

 

而且,训练和开发新的 AI 模型所需的基础设施的建造成本也极高,只有少数几家公司能够参与竞争。

 

微软总裁 Brad Smith 在巴塞罗那举行的世界移动通信大会上表示,微软将致力于一系列旨在鼓励 AI 创新和竞争的原则。他认为,监管机构最终将关注的更广泛问题是,训练和开发 AI 模型的基础设施是否可以广泛应用于没有自己的数据中心和云基础设施的公司。

 

微软与 Mistral 的合作将进一步加剧 AI 领域的竞争。微软、谷歌、亚马逊等科技巨头都在积极布局 AI 领域,并寻求在各自的平台上构建强大的 AI 生态系统。 未来,AI 技术将如何发展,值得我们拭目以待。

 

参考链接:

https://mistral.ai/news/mistral-large/

https://azure.microsoft.com/en-us/blog/microsoft-and-mistral-ai-announce-new-partnership-to-accelerate-ai-innovation-and-introduce-mistral-large-first-on-azure/

https://twitter.com/satyanadella/status/1762165185513722057

 

公众号推荐:

2024 年 1 月,InfoQ 研究中心重磅发布《大语言模型综合能力测评报告 2024》,揭示了 10 个大模型在语义理解、文学创作、知识问答等领域的卓越表现。ChatGPT-4、文心一言等领先模型在编程、逻辑推理等方面展现出惊人的进步,预示着大模型将在 2024 年迎来更广泛的应用和创新。关注公众号「AI 前线」,回复「大模型报告」免费获取电子版研究报告。

AI 前线公众号
2024-02-27 14:124488

评论 1 条评论

发布
用户头像
这次微软与法国开源大模型初创公司 Mistral 达成深度合作的消息真是令人振奋!Mistral AI 成立不久就已经估值 20 亿欧元,而且他们推出的最新旗舰模型 Mistral Large 也备受期待。与微软的合作将有助于 Mistral 将其 AI 模型推向市场,并用于开发满足欧洲各国政府和公共部门需求的应用程序。此外,Mistral Large 的推理能力也备受好评,这无疑将为 AI 技术的应用和发展带来新的动力。至于是否会成为“闭源”公司,以及模型定价等问题,我们还需要进一步观察。这次合作将进一步加剧 AI 领域的竞争,未来的发展令人期待。
2024-02-27 14:49 · 北京
回复
没有更多了

聚焦技术创新!旺链科技荣获“宝山区企业技术中心”认定

旺链科技

区块链 产业区块链 技术创新 12 月 PK 榜

软件测试丨让工作更高效,搞定Git的分支管理

测试人

git GitHub 软件测试 自动化测试 测试开发

GaussDB(DWS)运维 :遇到truncate执行慢,怎么办

华为云开发者联盟

数据库 后端 华为云 12 月 PK 榜

你可能需要的6个React开发小技巧

千锋IT教育

Mybatis源码解析之执行SQL语句

京东科技开发者

缓存 mybatis sql 源码学习 数据库·

四步骤打造银行智能标签体系,助力银行精准营销

袋鼠云数栈

智能标签 数据画像

Java开发如何通过IoT边缘ModuleSDK进行协议转换

华为云开发者联盟

Java 开发 华为云 12 月 PK 榜

FL Studio2024永久免费版音乐程序

茶色酒

FL Studio FL Studio2023 FL Studio21

为什么 OpenCV 计算的视频 FPS 是错的

百度Geek说

OpenCV ffmpeg 12 月 PK 榜 帧率

MatrixOne 0.6.0 :首个云原生架构的HTAP数据库发布!

MatrixOrigin

分布式数据库 云原生数据库 国产数据库 MatrixOrigin MatrixOne

开源依赖项管理指南

SEAL安全

12 月 PK 榜 依赖管理 传递依赖 开源依赖项

【其他】快出数量级的性能是怎样炼成的

No8g攻城狮

MySQL sql 数据库·

使用Spring Data Redis 发布订阅消息

码语者

redis Spring Boot message

BEVFormer-accelerate:基于EasyCV加速BEVFormer

阿里云大数据AI技术

深度学习 算法 计算机视觉 12 月 PK 榜

云服务器代理商选哪家好?理由是什么?

行云管家

云计算 服务器 云服务器

大咖说·施耐德|数智技术,企业绿色低碳转型的催化剂

大咖说

双碳 绿色转型

企业级大数据平台智能运维好帮手——星环科技多模数据平台监控软件Aquila Insight

星环科技

2022年12月中国数据库排行榜:OceanBase立足创新登榜首,华为腾讯排名上升树雄心

墨天轮

数据库 opengauss TiDB oceanbase 国产数据库

教你用JavaScript实现点击支付框

小院里的霍大侠

JavaScript 小白 编程开发 实战案例 初学者

真希望你也明白runtime.Map和sync.Map

面向加薪学习

面试 并发 源码阅读 go语言 Map集合

ArgoDB 5.1 正式发布:多模融合、实时分析和数据安全多重升级

星环科技

想做长期的 AB 实验?快来看看这些坑你踩了没

京东科技开发者

测试 测试原则 复盘归因 A/B 测试

Karmada多云多集群生产实践专场圆满落幕

华为云开发者联盟

云原生 华为云 12 月 PK 榜

超1800万累计观看,多次占据热榜前列……“无障碍字幕直播间”带来的远不止这些!

猿始人

云智慧蝉联中国IT统一运维ITSM软件市场第一!

云智慧AIOps社区

ITSM IT运维 运维管理

等保三级认证备案证明是哪个机构颁发?一般要多久?

行云管家

等保 等级保护 等保三级 等保备案

性能达1.5+倍!昇腾AI助力分子动力学模拟研究

华为云开发者联盟

人工智能 华为云 昇腾AI 12 月 PK 榜

云原生时代数据库运维体系演进

vivo互联网技术

数据库 运维 故障自愈

星环科技TDS 2.4.0 发布: 数据开发、数据治理、数据运营套件能力再次升级

星环科技

10个Python脚本来自动化你的日常任务

@下一站

Python 脚本 12月日更 12月月更

【知识分享】关于电子元器件封装的几个小知识

华秋PCB

封装 PCB PCB设计

欧洲版OpenAI被微软收编了,但这家号称专注于“开源”的大模型企业转向了”闭源“?_生成式 AI_Tina_InfoQ精选文章