Microsoft sta sviluppando un modello di linguaggio AI, con circa 500 miliardi di parametri
Microsoft sta attualmente sviluppando un nuovo grande modello di linguaggio chiamato MAI-1, che presenta circa 500 miliardi di parametri. Questo sviluppo colloca MAI-1 tra i modelli più grandi dell’industria, posizionandolo per competere con altri modelli significativi come GPT-4 di OpenAI e Gemini Ultra di Google.
MAI-1 è guidato da Mustafa Suleyman, una figura nota nello sviluppo di AI, che si è unito a Microsoft dopo il suo incarico a Google e come CEO di Inflection AI. Il modello viene sviluppato utilizzando un’infrastruttura sostanziale che include un grande cluster di server equipaggiati con GPU Nvidia. I dati di addestramento per MAI-1 includono testo generato da GPT-4 e altri contenuti web, indicando un set di dati di addestramento robusto e diversificato.
Lo sviluppo strategico di MAI-1 riflette l’impegno di Microsoft per avanzare le sue capacità in AI, indipendentemente dalle sue collaborazioni con altre entità di AI come OpenAI. Il modello è previsto essere integrato nei servizi cloud di Microsoft e potrebbe potenzialmente migliorare applicazioni come Bing e Azure.
Nonostante la grande scala di MAI-1, è progettato per funzionare nei centri di dati di Microsoft a causa della sua complessità, che lo rende inadatto per l’operazione su dispositivi consumer. Le applicazioni esatte e le capacità complete di MAI-1 sono ancora in considerazione, con la sua presentazione possibile al prossimo conferenza degli sviluppatori di Microsoft.
Sources