Leganerd.com
Menu

Il nuovo prototipo di ChatGPT è spaventosamente bravo con la matematica

OpenAI ha testato una versione segreta di ChatGPT sottoponendolo alle sfide dell'ultima edizione delle olimpiadi di matematica. Risultato? Ha portato a casa la medaglia d'oro.

Il nuovo prototipo di ChatGPT è spaventosamente bravo con la matematica

OpenAI ha fissato un nuovo punto di riferimento nel campo dell’intelligenza artificiale: un modello sperimentale, non ancora disponibile al pubblico, ha ottenuto prestazioni da medaglia d’oro all’International Math Olympiad, la competizione di matematica più prestigiosa per studenti delle scuole superiori di tutto il mondo. L’annuncio è arrivato su X dal ricercatore Alexander Wei, che ha parlato di una “sfida micidiale” finalmente superata grazie a un sistema capace di ragionare in maniera sorprendentemente vicina a quella umana.

Un modello che ragiona come un olimpionico

Il prototipo di OpenAI ha risolto cinque dei sei problemi proposti, totalizzando trentacinque punti su quarantadue e collocandosi idealmente fra i 67 concorrenti – il dieci per cento dei partecipanti – che quest’anno hanno conquistato l’oro. Gli esercizi, incentrati su algebra avanzata e pre‑calcolo, vengono costruiti per sembrare accessibili ma richiedono intuizione e creatività per ottenere il massimo punteggio.

Microsoft guadagna soldi ogni volta che usate ChatGPT, dice Nadella Microsoft guadagna soldi ogni volta che usate ChatGPT, dice Nadella

Fino a pochi mesi fa, la capacità di un’IA di elaborare dimostrazioni rigorose di livello olimpico era considerata lontana: gli LLM eccellono nella manipolazione di testi e dati, ma vacillano quando l’obiettivo è produrre argomentazioni matematiche senza falle logiche. Secondo Wei, il nuovo approccio integra un sistema specializzato di verifica passo‑passo che permette al modello di costruire catene di deduzioni coerenti, limitando gli errori tipici degli output “allucinati”. Proprio per questo, le grandi aziende stanno investendo risorse importanti nello sviluppo di modelli sperimentali ottimizzati per eccellere in matematica, logica e fisica.

E GPT‑5 quando arriva?

Sebbene il risultato mostri un netto salto in avanti, OpenAI non intende rilasciare a breve un modello consumer dotato di queste capacità. Sia Wei sia il CEO Sam Altman hanno chiarito che serviranno ancora mesi per rendere stabile e sicuro l’algoritmo, il che implica che il futuro GPT‑5 pur migliorando sul fronte del ragionamento non replicherà integralmente la performance olimpica.

L’obiettivo dichiarato è trasferire la logica “a prova di studente IMO” a campi più ampi, dall’ingegneria al coding scientifico, senza compromettere affidabilità e controllo. In prospettiva, la possibilità di “dialogare” con un assistente capace di dimostrare teoremi complessi apre scenari di collaborazione uomo‑macchina finora solo teorizzati, ma rilancia anche il dibattito su come certificare e verificare l’operato di modelli sempre più autonomi.

Fonte:
Ti potrebbero interessare