澳洲幸運(yùn)5app下載 微軟推出Maia 200 進(jìn)步 AI 推理門檻

微軟(Microsoft) 推出了 Maia 200,這是其用于驅(qū)動(dòng) AI 責(zé)任負(fù)載的自研芯片的最新迭代版塊。Maia 200 領(lǐng)有一些令東談主印象潛入的數(shù)據(jù),包括 10 petaflops 的 FP4 算力和 216GB 的HBM3,這讓 Microsoft 止境 Azure 云在 AI Token 生成方面得回了立竿見影的進(jìn)步。更緊迫的是,這給了 Microsoft在自研 AI 加快器方面越過 AWS 和 Google Cloud 的底氣。

Microsoft 暗示,Maia 200 是其首款挑升處治 AI 性能挑戰(zhàn)的芯片。除了原始的數(shù)字運(yùn)算能力,AI 推理還需要多數(shù)高速內(nèi)存,以及內(nèi)存和處理器之間的高速貫穿。Maia 200 似乎在這兩個(gè)方面齊有所斬獲。
Maia 200 給與臺(tái)積電 3nm (納米)工藝栽種,功耗瞎想(TDP)為 750 瓦。Maia 200 的中樞包含兩個(gè)試驗(yàn)引擎:一個(gè)是用于高隱隱量矩陣乘法和卷積的 Tile Tensor Unit(TTU:Tile 張量處理單位),復(fù)舊 FP8、FP6和 FP4 精度;另一個(gè)是用于 SIMD(單提示多數(shù)據(jù))提示的 Tile Vector Processor(TVP:Tile 向量處理器),提供 FP8、BF16和 FP32 處理能力。TTU 和 TVP 試驗(yàn)引擎聯(lián)接到 216GB 的高帶寬內(nèi)存(HBM3)以及 272MB 的片上TSRAM(Tile 靜態(tài)就地存取存儲(chǔ)器)。
Maia 200 配備了一個(gè)徑直內(nèi)存看望(DMA)子系統(tǒng),用于在 TSRAM 和TTU 之間保握數(shù)據(jù)流動(dòng),以及一個(gè)小的 Tile Control Processor(TCP:Tile 截至處理器)來合營TTU 和 DMA 之間的責(zé)任。
憑據(jù) Azure 工程博客中 Saurabh Dighe(系統(tǒng)與架構(gòu)副總裁)和 Artour Levin(AI 硅工程副總裁)撰寫的 Maia 200 深度默契,Maia 200 架構(gòu)的一個(gè)決定性特征是其豐富的內(nèi)存和內(nèi)存脈絡(luò)結(jié)構(gòu)。“這種雄壯的片上內(nèi)存資源復(fù)舊無為的各式低蔓延、高帶寬的數(shù)據(jù)照看戰(zhàn)略。”他們寫談。“CSRAM 和 TSRAM齊是完好意思軟件照看的,允許栽種者——或編譯器/啟動(dòng)時(shí)——詳情味地舍棄和固定數(shù)據(jù),以精準(zhǔn)截至數(shù)據(jù)的局部性和遷移。”

Maia 200 芯片配備了片上以太網(wǎng)收集接口卡(NIC),與相鄰芯片之間提供每秒 2.8 TB 的雙向帶寬。據(jù) Dighe 和 Levin 先容,Maia 200 給與了“兩層、縱向彭脹”拓?fù)浣Y(jié)構(gòu),蟻合了基于以太網(wǎng)的縱向彭脹互連,可在包含多達(dá) 6,144 個(gè)加快器的集群中提供高帶寬、低蔓延通訊。
Microsoft 暗示,它不錯(cuò)在一個(gè)“兩層、縱向彭脹”集群拓?fù)渲新?lián)接多達(dá)6,144 個(gè) Maia 200 加快器。
據(jù) Dighe 和Levin 稱,Maia 200 的 Tile 級(jí)處理能力,蟻合 DMA 和片上收集能力,使芯片或者達(dá)到現(xiàn)在大限度 AI 責(zé)任負(fù)載所需的無為限度。“DMA 引擎專為多通談、高帶寬傳輸而瞎想,復(fù)舊 1D/2D/3D 步進(jìn)遷移,使常見的 ML 張量布局或者在片上 SRAM、HBM和外部接口之間高效遷移,同期終了數(shù)據(jù)遷移與籌謀的重復(fù),”他們寫談。“同期,NoC 在集群和內(nèi)存子系統(tǒng)之間提供可彭脹、低蔓延的通訊,并復(fù)舊單播和多播傳輸——這是分發(fā)張量塊和合營并行試驗(yàn)的緊迫能力。”
{jz:field.toptypename/}距離 Microsoft 推出 Maia 100——其首款挑升用于 AI 推理的第一代 AI 加快器——?jiǎng)倓偼鶗r(shí)兩年多。Maia 100 給與臺(tái)積電 5 納米工藝栽種,提供每秒 1.8 TB 的雙向內(nèi)存帶寬和 64GB SRAM。它提供 3.2 petaflops 的 MXFP4 性能和 1.6 petaflops 的 FP8 或 MXInt8 性能,茍簡是Maia 200 的三分之一。
Maia 200 的能力與其他頂級(jí) AI 加快器相稱,使其成為“AI 推理能源源”,Microsoft 云和 AI 試驗(yàn)副總裁 Scott Guthrie 暗示:“本色上,Maia 200 不錯(cuò)爽直啟動(dòng)現(xiàn)在最大的模子,并為改日更大的模子留出迷漫的空間。”“Maia 200 是來自任何超大限度云勞動(dòng)商的最遒勁的第一方硅芯片,其 FP4 性能是第三代 Amazon Trainium 的三倍,F(xiàn)P8 性能高于 Google 第七代 TPU。”他還補(bǔ)充說:“Maia 200 亦然 Microsoft 部署過的最高效的推理系統(tǒng),與咫尺咱們機(jī)群中的最新代硬件比較,性能進(jìn)步了 30%。”

Maia 200 可在風(fēng)冷和水冷環(huán)境中啟動(dòng)。它的瞎想旨在與 Azure 的第三方 GPU 機(jī)群協(xié)同責(zé)任,并死守機(jī)架、電源和機(jī)械架構(gòu)的法式。它集成到 Azure 的原生截至平面中,Microsoft 這使得部署和勞動(dòng)變得安若泰山,同期與歸并數(shù)據(jù)中心空間內(nèi)的其他 AI 加快器融合共存。
Microsoft 籌算使用其 Maia 200 芯片啟動(dòng)各式模子,包括最新的 OpenAI GPT-5.2 模子。它還將用于生成合成數(shù)據(jù),供 AI 模子用于考試方向。新芯片咫尺部署在 Microsoft 位于愛荷華州得梅因近鄰的 Central 數(shù)據(jù)中心區(qū)域。它接下來將部署在亞利桑那州鳳凰城近鄰的 US West 3 數(shù)據(jù)中心區(qū)域,改日還會(huì)有更多區(qū)域跟進(jìn)。

備案號(hào):