Deepseek

Le indiscrezioni sul modello di intelligenza artificiale DeepSeek R2 iniziano a circolare online

Secondo quanto annunciato, sembra che l’azienda cinese DeepSeek sia pronta a lanciare sul mercato un altro modello, dato che su Internet sono emersi dettagli sul suo prossimo modello DeepSeek R2. Prima di entrare nei dettagli, รจ importante prendere le indiscrezioni con un granello di sale, poichรฉ DeepSeek non ha ancora confermato le cifre ufficiali del suo prossimo modello. Le fonti cinesi sostengono che il modello R2 adotterร  un’architettura ibrida MoE (Mixture of Experts), che si dice sia una versione avanzata dell’implementazione MoE esistente, probabilmente dotata di meccanismi di gating avanzati o di una combinazione di MoE e strati densi per ottimizzare i carichi di lavoro di fascia alta. Con questa architettura, DeepSeek R2 dovrebbe avere il doppio dei parametri di R1, con 1,2 trilioni.

Basandosi solo su questa cifra, si dice che R2 sia in grado di competere con GPT-4 Turbo e Gemini 2.0 Pro di Google, ma questa non รจ l’unica area in cui DeepSeek intende avere un impatto. Il rapporto sostiene che con DeepSeek R2 i costi unitari per token sono inferiori del 97,4% rispetto a GPT-4 -4, con 0,07$/M token di input e 0,27$/M token di output. Rispetto ai prezzi di OpenAI, il modello R2 di DeepSeek sarร  un affare per le aziende, in quanto sarร  il modello piรน economico in circolazione. Questo rilascio potrebbe rivelarsi un momento decisivo per l’IA e l’economia che la circonda.

Deepseek