macOS Tahoe 26.2 将为 M5 Mac 带来巨大的机器学习速度提升

文章配图

使用 MLX 的机器学习研究人员将受益于 macOS Tahoe 26.2 的速度提升,包括对基于 M5 GPU 的神经加速器和 Thunderbolt 5 集群的支持。

机器学习领域的研究人员使用苹果的 MLX 框架已有一段时间,它有助于利用苹果硬件训练和部署模型。作为苹果对 macOS Tahoe 26.2 更新的一部分,使用较新硬件的用户有望看到一些潜在的性能改进。

MLX 是苹果的开源机器学习框架,旨在利用 Apple Silicon 的特性。它可以在任何支持 Metal 的苹果平台上运行,并能从 CPU 和 GPU 处理以及统一内存等方面受益。

如果研究人员在 M5 Mac 上运行,他们将注意到的第一个重大变化是对 GPU 处理的调整。在此次 macOS 更新下,MLX 现在将支持苹果在 M5 芯片的每个 GPU 核心中包含的神经加速器。

自 M5 推出以来,新的 GPU 架构已可供开发人员使用,他们可以使用 Tensor API 以及苹果的 Metal 4 和 Core ML 框架直接编写代码调用神经加速器。在此更新下,MLX 将原生支持神经加速器的使用。

对机器学习研究人员而言,结果是他们可以享受到设备端处理性能的大幅提升。至少在初始响应提示时,其峰值 AI 性能可能达到在 M4 芯片上运行相同大语言模型(LLM)的四倍。

集群

macOS Tahoe 26.2 中 MLX 的另一项变化是包含了一个新的驱动程序,该驱动程序有利于集群计算。具体来说,扩展了支持范围,使其能够与 Thunderbolt 5 协同工作。

研究人员之前已经能够使用 Thunderbolt 将多台 Mac 连接在一起,通过 MLX 进行处理。该技术将一个大语言模型(LLM)拆分到通过 Thunderbolt 连接的多台 Mac 上,分担工作负载并共享可用的统一内存。

这都可以通过以太网以高达 10Gb/s 的速度运行,具体取决于 Mac 的规格。然而,使用 Thunderbolt 可以实现比典型网络高得多的 Mac 间连接速度。

用于此类集群的 Thunderbolt 4 最高速度可达 40Gb/s。Thunderbolt 5 将带宽扩展至 80Gb/s。

我们向苹果询问了此速度提升的具体细节,但尚未收到回复。

无论如何,支持 Thunderbolt 5 的更改有效地提高了集群中 Mac 之间的连接速度。这在远程直接内存访问(RDMA)下尤其有用,RDMA 是一种网络方式,其中一台计算机可以直接访问另一台计算机的内存。

在通过 Thunderbolt 连接的 Mac 集群中,Mac 之间相互共享内存,从而创建出比单台 Mac 通常可用内存更大的内存池。对于一台 Mac 的内存容量而言过大的 LLM 会被分解成块,存储在各台 Mac 上,然后集群中的任何 Mac 都可以访问这些数据块。

虽然这主要被认为有利于聚合集群中的内存,但苹果支持 Thunderbolt 5 的更改也有助于改进计算聚合。使用 Tensor 框架可以以对延迟敏感的方式增加 CPU 间的通信,而增加的 Thunderbolt 5 带宽有助于缓解这一问题。

这里的要点是,它将通过增加集群中每台 Mac 之间的内存带宽和整体通信来提高性能。

持续助力开发,但期待更好的未来

M5 GPU 神经加速器支持将使所有使用较新 Mac 的用户受益,其程度超过集群技术,后者将由资金雄厚的研究人员体验。最终,这一切都是为了通过使用相对容易获得的商用硬件来推动机器学习发展。

苹果已经不得不忍受苹果智能(Apple Intelligence)缓慢的推广和拖延已久的 Siri 全面改革所带来的阴影。然而,以这种方式支持 AI 发展对苹果是有利的,苹果在其产品中一直依赖本地 ML 处理。

MLX 用户可以通过使用 Thunderbolt 将多个不同的 Apple Silicon 机器组合在一起来实现这一点。如果所有机器都支持 Thunderbolt 5,它们都将拥有改进的设备间通信能力。

同样,如果研究人员在一台 M5 Mac(如 14 英寸 MacBook Pro)上进行处理,他们也会看到性能提升。

然而,有一个问题,即在当前的 Apple Silicon 产品线中,研究人员无法同时从这两项改进中受益。目前,只有一款 M5 型号,它支持速度较慢的 Thunderbolt 4,而不是 Thunderbolt 5。

当苹果发布支持 Thunderbolt 5 的 Mac 型号时,这种情况应该会改变,例如预计在 2026 年初发布的 M5 Pro 和 M5 Max 版本。

预计这将包括采用 M5 和 M5 Pro 形态的 Mac mini 的更新,后者将同时受益于 GPU 神经加速器和 Thunderbolt 5。

大约在同一时间,我们预计 Mac Studio 也会更新,苹果实际上已经用 Mac Studio 取代 Mac Pro 作为高性能 Mac 的选择。对于 Mac Studio,选项应包括 M5 Max 以及可能的 M5 Ultra 版本。

对于长期的苹果用户来说,MLX 可以被视为 Xgrid 概念的现代复兴,Xgrid 通过分布式计算的方式将一组 Mac 变成一台超级计算机。MLX 方法类似之处在于工作被分布到多台 Mac 上,不同之处在于节点之间的通信速度可以比早已消亡的 Xgrid 曾经能够达到的速度快得多。

MLX 下的集群计算技术也为研究人员提供了一种最大化其计算预算的方法。一台低功耗的 Mac 可以用作集群的控制器,将任务分配给性能强大的机器进行实际处理。

例如,您可以设置一个具有大内存但存储最少的 Mac Studio 集群来处理繁重的计算任务。但是,他们也可以使用像 MacBook Air 这样的低功耗设备在集群上运行查询、显示结果和管理设置。

苹果已告知我们,几天内将有更多信息发布。

Related Posts

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注