Nella giornata conclusiva della serie livestream “12 Days of OpenAI,” l’azienda ha svelato il suo prossimo modello di punta, chiamato ChatGPT o3. Con un pizzico di ironia, il CEO Sam Altman ha spiegato la scelta del nome, citando la difficoltà di OpenAI nel trovare denominazioni originali e rendendo omaggio a Telefónica, proprietaria del network europeo O2.
Il modello o3 non è ancora disponibile al pubblico. Per il momento, OpenAI lo metterà a disposizione dei ricercatori per approfondire i test di sicurezza. Inoltre, è stato annunciato o3-mini, una versione ottimizzata che dovrebbe essere lanciata entro fine gennaio, mentre o3 arriverà poco dopo.
OpenAI promette prestazioni rivoluzionarie
La grande innovazione di o3 rispetto al suo predecessore, o1, risiede nelle sue prestazioni straordinarie. Durante l’American Invitational Mathematics Examination, o3 ha raggiunto un’accuratezza del 96,7%, superando di gran lunga l’83,3% di o1. Questo risultato è indicativo della sua capacità di commettere errori minimi nei test matematici più complessi.
Tra le prove più significative c’è l’ARC-AGI, un benchmark progettato per valutare la capacità di apprendimento intuitivo e immediato di un’intelligenza artificiale. Sebbene nessun modello AI abbia mai superato questo test dal suo debutto nel 2019, o3 ha raggiunto un punteggio dell’87,5% con configurazioni avanzate, superando persino la media umana dell’85%.
O3-Mini offrirà una versatilità estremamente robusta
Il modello o3-mini, viceversa, è progettato per chi cerca un equilibrio tra prestazioni e costi computazionali. Grazie alla nuova API Adaptive Thinking Time, offre tre modalità di ragionamento – Low, Medium e High – consentendo di regolare il tempo dedicato all’elaborazione di un problema. Questo approccio rende o3-mini comparabile al modello o1 in termini di risultati, ma con costi decisamente ridotti per aziende e sviluppatori.
La combinazione di o3 e o3-mini punta a ridefinire gli standard nel campo dell’intelligenza artificiale, aprendo nuove prospettive per applicazioni più sofisticate e accessibili. Una mossa dovuta, considerando che la concorrenza di Google e Claude si sta facendo sempre più agguerrita.