Panmnesia, una startup del KAIST, ha presentato un IP all’avanguardia che consente di aggiungere memoria esterna alle GPU AI utilizzando il protocollo CXL su PCIe, rompendo le barriere delle capacitร di memoria. Gli attuali acceleratori di intelligenza artificiale sono limitati alla memoria interna, poichรฉ i produttori possono inserire solo una quantitร limitata di HBM. Con l’aumento dei dataset e la necessitร di potenza, il settore si sta concentrando sull’accumulo di GPU AI, ma questo approccio non รจ sostenibile a lungo termine se si considerano le risorse finanziarie e produttive che richiede. Alla luce di ciรฒ, Panmnesia, un’azienda sostenuta dall’istituto sudcoreano KAIST, ha presentato un IP CXL che puรฒ consentire alle GPU di sfruttare la memoria da DRAM o persino da SSD, espandendosi dalla HBM incorporata.
Per colmare la connettivitร , CXL utilizza collegamenti PCIe, assicurando un’adozione di massa da parte dei consumatori. Tuttavia, c’รจ un problema. Gli acceleratori AI tradizionali non dispongono dei sottosistemi necessari per connettersi e utilizzare direttamente il CXL per l’espansione della memoria e le soluzioni come UVM (Unified Virtual Memory) sono piuttosto lente, il che vanifica l’obiettivo iniziale. Tuttavia, come soluzione, Panmnesia ha sviluppato il proprio chip Root Complex conforme a CXL 3.1, che dispone di piรน porte che collegano la GPU alla memoria esterna attraverso un bus PCIe e il decoder HDM (Host-Managed Device Memory) funge da ponte tra le connessioni, gestendo l’allocazione e la traduzione della memoria.
ร interessante notare che Panmnesia ha deciso di confrontare la propria soluzione (CXL-Opt) con i prototipi sviluppati da Samsung e Meta, etichettati come “CXL-Proto”. Con nostra sorpresa, CXL-Opt ha ottenuto una latenza di andata e ritorno significativamente inferiore, ovvero il tempo impiegato dai dati per spostarsi dalla GPU alla memoria e viceversa. CXL-Opt ha mostrato una latenza a due cifre di nanosecondi, mentre CXL-Proto aveva una latenza di 250ns. A parte questo, il tempo di esecuzione di CXL-Opt รจ di gran lunga inferiore a quello della soluzione UVM, in quanto raggiunge velocitร di prestazioni IPC 3,22 volte superiori a UVM.