Da qualche giorno, OpenAI ha annunciato GPT-4, cioè l’ultima iterazione del modello linguistico di grandi dimensioni alla base di ChatGPT, il chatbot di cui si sta parlando ossessivamente da ormai diversi mesi.
Sebbene non sia una totale rivoluzione, in realtà il nuovo modello introduce numerose ed importanti novità, a partire dal fatto che questa volta si tratta di un modello multimodale: ChatGPT, in altre parole, riconosce e input non soltanto testuali, ma anche multimediali. Ad esempio si può istruire il chatbot a creare qualcosa partendo da uno schizzo, e dunque da un’immagine.
In generale, la nuova tecnologia restituisce risultati migliori e lo fa più rapidamente. Chi l’ha provata sostiene che la qualità del testo sia migliorata in maniera significativa, anche se è la stessa OpenAI a sottolineare che, quando si usa ChatGPT per compiti estremamente semplici, le differenze rispetto alla precedente versione potrebbero essere molto sottili e, dunque, potenzialmente impercettibili ad un occhio poco attento. Viceversa, quando si usa l’IA per compiti molto complessi, il gap prestazionale con il precedente modello, GPT-3.5, diventa evidente ed estremamente vasto.
Cosa può fare di nuovo ChatGPT con GPT-4?
Come dicevamo poco sopra, la più grande novità è che ora ChatGPT è multimodale. Questa è la differenza principale, quella più visibile e immediata anche ad un occhio “profano”.
Il chatbot ora riconosce anche le immagini, e non soltanto i testi. Tuttavia, per il momento il chatbot può ancora solo restituire risultati testuali. In altre parole, puoi usare un’immagine per far capire all’IA che tipo di risultato ti serve, ma non puoi chiedere all’IA di generare un’immagine o un video, come invece possono fare Dall-E (sempre di OpenAI) o altre intelligenze artificiali generative di quel tipo.
Ad ogni modo, si tratta di un cambiamento epocale. In rete si trovano già alcuni esempi impressionanti di ciò che è possibile fare grazie alla nuova modalità. Ad esempio, un utente di Twitter ha spiegato di aver chiesto, con successo, a ChatGPT di scrivere il codice di una homepage di un sito semplicemente partendo da uno schizzo. In sostanza, è possibile progettare un intero sito internet senza competenze di web design o informatiche.
Per la cronaca, lo stesso processo può essere utilizzato anche per creare delle applicazioni, o addirittura dei videogiochi. Anche GPT-3.5 era in grado di scrivere linee di codice, al punto che era stato utilizzato con successo per inventare e generare da zero un gioco di enigmistica completamente giocabile, ma la differenza è che grazie agli input multimediali ora è possibile istruire l’IA in maniera molto più precisa su ciò che si vuole ottenere. E la qualità dei risultati migliora di conseguenza.
gpt-4 can turn your napkin sketch into a web app, instantly.
we are deep into uncharted territory here.pic.twitter.com/V5HtYHgS6u
— Siqi Chen (@blader) March 14, 2023
Lo stesso utente ci segnala che IA è perfettamente in grado di comprendere e analizzare il contenuto di un’immagine. Come in questo caso, dove ChatGPT viene utilizzato per spiegare il significato di un meme:
gpt-4 (visual) is multi-modal.
which means it can take images as input.
so it can explain memes like this: pic.twitter.com/GJUNLwMjrh
— Siqi Chen (@blader) March 14, 2023
Un altro utente ha spiegato di essere riuscito ad usare GPT-4 PER creare un clone di Pong, lo storico primo videogioco di massa, in 60 secondi. Anche in questo caso, per ottenere un risultato simile non serve nessuna competenza informatica e questo è di per sé impressionante:
I don’t care that it’s not AGI, GPT-4 is an incredible and transformative technology.
I recreated the game of Pong in under 60 seconds.
It was my first try.Things will never be the same. #gpt4 pic.twitter.com/8YMUK0UQmd
— Pietro Schirano (@skirano) March 14, 2023
GPT-4, promosso a pieni voti anche all’esame da avvocato
Più in generale, possiamo dire (prendendoci ovviamente una grande libertà) che GPT-4 è enormemente più “intelligente”, fornisce risposte più complete e scritte meglio, tende a sbagliarsi meno frequentemente e inciampa più raramente nelle cosiddette “allucinazioni” (una parola che indica gli svarioni, talvolta inquietanti, delle IA generative).
Recentemente Forbes ha riportato che GPT-4 è stato sottoposto anche all’esame da avvocato (dell’ordinamento statunitense), ottenendo risultati strabilianti. Quanto strabilianti? L’IA è stata in grado di ottenere un punteggio paragonabile a quella del miglior 10% dei candidati che ogni anno si sottopongono al test. Insomma, l’IA si è dimostrata più competente del 90% degli aspiranti avvocati. Giudicate voi se questo depone a favore del bot o a sfavore di chi esce da una facoltà di legge nell’anno del Signore 2023.
OpenAI sostiene che la sua intelligenza artificiale ottenga risultati paragonabili a quelli di un essere umano nella maggior parte degli esami professionali o accademici. O, meglio, di un essere umano che si posizione nel 10° o addirittura 1° percentile.
OpenAI sostiene che l’IA abbia ottenuto risultati molto simili, e dunque eccellenti, anche in numerosi altri test sulle materie più disparate: dalla matematica alla letteratura, passando per la biologia e l’enologia.
OpenAI sostiene che la sua intelligenza artificiale ottenga risultati paragonabili a quelli di un essere umano. O, meglio, di un essere umano che si posizione nel 10° o addirittura 1° percentile. È questo il caso del test delle olimpiadi di biologia, dove ChatGPT ha ottenuto un punteggio più alto del 99% dei partecipanti.
“GPT-4 ottiene performance a livello umano nella maggior parte degli esami professionali e accademici esistenti”, sostiene l’azienda dietro al chatbot. Per il momento ChatGPT basato su GPT-4 è stato sottoposto a 34 esami diversi.
Ad ogni modo, sembra che ChatGPT non sia ancora in grado di conquistare il mondo e schiavizzare gli umani. Lo diciamo perché OpenAI ha realmente cercato di capirlo con alcuni test.
In compenso, se avete bisogno di rassicurazioni, vale la pena di precisare che GPT-4 non è ancora a livelli di Skynet. Insomma, non è sufficientemente intelligente da poter conquistare il mondo, dominare l’umanità e mettere in pericolo la sopravvivenza della nostra razza. Lo diciamo perché OpenAI ha realmente sottoposto l’IA ad alcuni test per accertarsene.
OPenAI ha concesso all’Alignment Research Center (ARC) l’accesso anticipato a più versioni del modello GPT-4 per condurre alcuni test. In particolare, l’ARC ha valutato la capacità del GPT-4 di formulare piani ad alto livello, creare copie di sé stesso, acquisire risorse (cioè la capacità di moltiplicare il denaro e arricchirsi con investimenti), nascondersi su un server e condurre attacchi di phishing.
La conclusione? “Valutazioni preliminari delle capacità del GPT-4, condotte senza un’ottimizzazione specifica del compito, hanno dimostrato che non è efficace nella replicazione autonoma, nell’acquisizione di risorse e nel resistere ai tentativi di farsi disattivare, laddove dovesse andare fuori controllo.
Come posso provare GPT-4?
Arriviamo quindi alla domanda immediatamente successiva. Come si può provare l’IA basata sul nuovo modello GPT-4? Esistono alcuni modi. Il nuovo modello è, infatti, già stato integrato all’interno di numerosi prodotti e servizi, alcuni dei quali gratuiti, mentre altri sono a pagamento.
Ad esempio, GPT-4 è alla base di Duo, il nuovo tutor virtuale basato su intelligenza artificiale di Duolingo. Attualmente è disponibile esclusivamente agli abbonati a Duolingo Max, inoltre bisogna avere iOS con lingua settata su inglese e supporta esclusivamente l’insegnamento delle lingue francese e spagnola. Per il momento, probabilmente un domani l’abbonamento verrà portato anche in Italia e supporterà anche altre lingue.
GPT-4 è ovviamente stato integrato anche su ChatGPT, il servizio più famoso di OpenAI. Ma non per tutti, non ancora. Se sei un utente non pagante, attualmente la versione di ChatGPT che stai utilizzando è ancora basata su GPT-3. Ovviamente molto presto il chatbot metterà a disposizione di tutti il nuovo modello. Storia diversa per gli abbonati a ChatGPT Plus, abbonamento con un costo mensile di 20$, che offre accesso in anteprima a tutte le nuove funzioni sperimentali del chatbot, incluso il modello GPT-4. Anche in questo caso, ci sono delle limitazioni: ad esempio in alcuni casi il traffico potrebbe essere troppo intenso, e in quel caso OpenAI potrebbe limitare l’accesso al modello GPT-4 ad alcuni utenti.
Esiste comunque un modo estremamente semplice per sondare le potenzialità di GPT-4. Il nuovo modello è già stato integrato all’interno di Bing Chat, il chatbot basato su ChatGPT di Microsoft. Peraltro, da pochissimi giorni è possibile accedere alla nuova funzione di Bing senza tempi d’attesa, vi basta farne richiesta qui e riceverete immediatamente un’email con delle istruzioni da seguire. Questo è di gran lunga il metodo più semplice per testare GPT-4 ed è anche completamente gratuito.