NVIDIA 初创加速计划,免费加速您的创业启动 了解详情
写点什么

苹果公司开源机器学习框架 MLX,针对 Silicon 芯片进行了优化

作者:Sergio De Simone

  • 2024-01-10
    北京
  • 本文字数:1139 字

    阅读完需:约 4 分钟

大小:571.58K时长:03:15
苹果公司开源机器学习框架MLX,针对Silicon芯片进行了优化

苹果公司的机器学习框架MLX结合了开发者熟悉的 API、可组合的函数转换和惰性计算,部分灵感源于 NumPy 和 PyTorch,并针对苹果的 Silicon 进行了优化。该框架使用 Python 和 C++实现,旨在为在苹果 Silicon 上训练和部署机器学习模型提供用户友好且高效的解决方案。


根据苹果公司的说法,MLX 是由机器学习研究人员为机器学习研究人员设计的,并基于 MIT 发布许可,可以很容易地被扩展和改进。它支持转换语言模型训练、使用 Mistral 进行大规模文本生成、使用 Stable Diffusion 进行图像生成以及使用 Whisper 进行语音识别。


MLX 提供了受 NumPy 启发的底层 Python API 和一个完整的与之密切对应的 C++ API。此外,它还提供了一个高级 API,可用于根据 PyTorch API 创建更复杂的模型。


该框架支持自动微分、自动向量化和计算图优化,可组合的函数使得构建复杂数组转换变得更加容易。MLX 还支持惰性计算,这意味着它可以只在必要时才计算数组,以提高计算效率。同样,计算图是动态构建的,因此修改函数参数并不会触发缓慢的编译过程。


MLX 的一个独有的特性是使用了苹果 Silicon 的统一内存,这让它有别于其他的 ML 框架。这意味着数组位于共享内存中,可以在 CPU 或 GPU 上执行数组操作,无需在内存之间传输数据。例如,在创建一个数组时,你不需要指定位置,因为它位于统一内存中,而在执行操作时可以选择在 CPU 或 GPU 上执行转换:

a = mx.random.normal((100,))
b = mx.random.normal((100,))
mx.add(a, b, stream=mx.cpu)
mx.add(a, b, stream=mx.gpu)
复制代码


MLX 可在任意的苹果 Silicon CPU 上运行,包括 M1,并可以利用集成的 GPU,因此研究人员可以选择最适合其需求的硬件。


MLX 的代码库中包含了一些针对不同模型的示例,包括 BERT、Llama、Mistral、Stable Diffusion 等。每个示例都在requirements.txt文件中列出所需的依赖项,并提供了现成的 CLI 工具。例如,要使用 Stable Diffusion 生成图像,首先安装所有必需的依赖项,然后运行txt2image.py命令:

pip install -r requirements.txt

python txt2image.py "A photo of an astronaut riding a horse on Mars." --n_images 4 --n_rows 2


苹果尚未公开发布基准测试,因此我们目前不知道它与PyTorch/MPS或 Georgi Gerganov 的Llama.cpp相比表现如何。


不过,Stable Diffusion 示例中包含了使用 PyTorch 和 MLX 运行 UNet 的性能比较。MLX 在批次大小为 16 时的吞吐量比 PyTorch 高约 40%,最佳批次大小大 15%左右。


然而,PyTorch 在较小的批次大小时表现更好,批次大小为 1 时吞吐量高约 50%,批次大小为 4 时高约 10%。根据苹果公司的说法,PyTorch 在这些情况下的优势要归因于在模型还没有被加载到内存中且 PyTorch 的 MPS 图内核未被缓存时的编译速度。


如果你有兴趣体验 MLX,请参阅其快速入门指南完整文档


原文链接

https://www.infoq.com/news/2023/12/apple-silicon-machine-learning/

公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2024-01-10 08:007823

评论

发布
暂无评论

要不要做一个gif动态图玩一下?

诸葛小猿

GIF ScreenToGif 动态图

ARST Week7

时之虫

ARTS 打卡计划

[译] 图说前端-组件、Prop 和 State

梦见君笑

大前端 React 漫画编程

U盘+grub2安装centos8实战

程序饲养员

架构师训练营第六周作业--doris临时失效时序图

CATTY

时序图

万字详解加拿大央行CBDC分析报告

CECBC

工程规约 - maven统一管理

Man

maven DevOps 工程规约

[译] 图解前端-深入理解 Props 和 State

梦见君笑

大前端 React 漫画编程

vue项目发布时去除console语句

网站,小程序,APP开发定制

架构师训练营第六周学习总结

CATTY

架构师课程第六周 作业

杉松壁

大话设计模式 | 4. 装饰模式

Puran

C# 设计模式

创业使人成长系列 (3)- 如何取个好名字

石云升

创业 成长 取名

架构师训练营第六周作业

talen

ARTS 04 - 使用 Gitlab + Generic Webhook Trigger 触发 Jenkins 自动化构建

jerry.mei

算法 ARTS 打卡计划 CI/CD 函数式编程 Elixir

技术解读:单集群如何做到2万+规模

数据湖洞见

大数据 FusionInsight 华为云 大集群

JavaScript 混淆与逆向必读之 AST 节点类型名词基础

穿甲兵

Java

java8的parallelStream提升数倍查询效率

网站,小程序,APP开发定制

java8

海南的七星彩网站系统盘口代码解析

网站,小程序,APP开发定制

代码

关于架构的几件小事:架构概述(1)

北风

架构 架构设计 架构师 架构设计原则

如何编写可怕的 Java 代码?

武培轩

Java 编程 程序员 后端

AOP有几种实现方式?

八苦-瞿昙

技术 随笔杂谈 aop 代理 框架

如何使用预测性指标衡量敏捷转型的成功?

Atlassian

敏捷开发 开发工具 Atlassian Jira

如何在 Go 中写出高效的单元测试

Grafana 爱好者

testing slideshare Go 语言

阿里花500万年薪招天才黑客?官方回应:这种人得交给警察

程序员生活志

黑客 阿里

架构师训练营第六周学习总结

张明森

了不起的 Webpack Scope Hoisting 学习指南

pingan8787

Java 大前端 webpack

帮助小团队实现大梦想 | Atlassian 云产品免费使用

Atlassian

使用 Generic Webhook Trigger 触发 Jenkins 多分支流水线自动化构建

jerry.mei

DevOps 持续集成 jenkins CI/CD 持续交付

[译] 图说前端-图解 React

梦见君笑

大前端 React 框架

[译] 图说前端-图解 React Native

梦见君笑

大前端 漫画编程

苹果公司开源机器学习框架MLX,针对Silicon芯片进行了优化_芯片_InfoQ精选文章