Nell’ambito degli sviluppi più recenti nel settore dell’intelligenza artificiale, Sundar Pichai, CEO di Alphabet (la casa madre di Google), ha effettuato una mossa audace ad aprile: ha fuso due grandi team di intelligenza artificiale che fino a pochi mesi fa lavoravano con culture, tipologie di codice e applicazioni diverse. Una scelta rischiosa, ma dettata da un obiettivo ambiziosissimo: difendere la supremazia di Google e battere un rivale agguerrito come OpenAI.
I risultati di questo sforzo iniziano a vedersi. Centinaia di persone lavorano alacremente al rilascio di una serie di grandi modelli di apprendimento automatico, che rappresentano uno dei prodotti a più alto rischio mai realizzati dalla società. Questi modelli sono noti collettivamente come “Gemini“.
Secondo quanto riportato da The Information, e sostenuto da una fonte interna al progetto, Gemini si prefigge di offrire a Google capacità senza precedenti, superando i limiti dei modelli concorrenti. Mentre LLM come GPT-4 di OpenAI possono comprendere e produrre testo conversazionale, Gemini ambisce a superare questo confine. Oltre alle capacità testuali simili a quelle di GPT-4, Gemini avrà anche la capacità di creare immagini AI basate su una descrizione testuale, in un modo simile ai generatori di immagini AI come Midjourney e Stable Diffusion.
Ma le ambizioni per Gemini non si fermano qui. È emerso che i dipendenti di Google hanno discusso l’uso di Gemini per offrire funzionalità come l’analisi di grafici, la creazione di grafica basata su descrizioni testuali e il controllo del software tramite comandi vocali o testuali. Con Gemini, Google punta a potenziare una serie di servizi, dal chatbot Bard, che concorre con il ChatGPT di OpenAI, alle app aziendali come Google Docs e Slides. Inoltre, l’azienda prevede di offrire l’accesso a Gemini agli sviluppatori di app attraverso Google Cloud. Ciò potrebbe aiutare Google a competere con Microsoft, che ha introdotto nuove funzionalità AI per le sue app Office 365 e vende l’accesso ai modelli di OpenAI ai suoi clienti business.