AMD

AMD abilita i modelli AI GPT-OSS 20B e 120B di OpenAI su hardware Ryzen e Radeon

Secondo quanto svelato da poco, con il lancio dei modelli GPT-OSS 20B e 120B AI di OpenAI, AMD annuncia che le sue GPU Ryzen AI MAX e Radeon li supportano completamente con funzionalitร  migliorate. Cos’รจ GPT-OSS? Si tratta di modelli open-weight progettati per gestire ragionamenti complessi e capacitร  agentiche. Mentre la maggior parte dei PC e dei chip AI sarร  in grado di gestire il modello da 20B, il modello da 120B richiede piรน risorse hardware. รˆ qui che entrano in gioco i chip Strix Halo o Ryzen AI MAX di AMD. Con un pool di memoria massimo di 128 GB, questi chip sono progettati per gestire nativamente tali modelli AI.

I pesi MXFP4 convertiti in GGML richiedono circa 61 GB di VRAM e si adattano perfettamente alla memoria grafica dedicata da 96 GB del processore AMD Ryzen AI Max+ 395. Si noti che per sbloccare questa funzionalitร  รจ necessaria una versione del driver uguale o superiore a AMD Software: Adrenalin Edition 25.8.1 WHQL. Con velocitร  fino a 30 token al secondo, i clienti AMD non solo hanno accesso a un modello all’avanguardia di classe data center, ma le prestazioni sono ampiamente sfruttabili grazie alla larghezza di banda della piattaforma Ryzen AI Max+ e all’architettura mista di esperti di OpenAI GPT-OSS 120B. Grazie alla sua ampia memoria, Ryzen AI Max+ 395 (128 GB) supporta anche le implementazioni del Model Context Protocol (MCP). Gli utenti con processori AMD Ryzen AI serie 300 possono anche sfruttare appieno il modello piรน piccolo da 20 GB di OpenAI.

Per prestazioni fulminee con il modello OpenAI GPT-OSS 20B, gli utenti possono utilizzare la scheda grafica AMD Radeon 9070 XT da 16 GB in un sistema desktop. Questa configurazione non solo offre token al secondo fulminei, ma offre anche un incredibile vantaggio in termini di TTFT. Ciรฒ significa che gli utenti che utilizzano implementazioni del Model Context Protocol (MCP) con i modelli 20B otterranno prestazioni TTFT estremamente reattive con questa configurazione in situazioni tipicamente legate al calcolo.