ChatGPT-4, l’ultima versione del chatbot sviluppato da OpenAI, avrebbe superato per la prima volta il test di Turing dopo diversi test negativi. Questo risultato è stato ottenuto grazie a uno studio, pubblicato sulla rivista Proceedings of the National Academy of Sciences (PNAAS), condotto da un gruppo di ricercatori coordinato dal professor Matthew Jackson della Stanford School of Humanities and Sciences. Secondo lo studio, ChatGPT-4 dimostra tratti di personalità sovrapponibili a quelli umani e risponde in modo simile a un essere umano in alcune situazioni.
Cos’è il test di Turing?
Il test di Turing, ideato dal matematico Alan Turing nel 1950, valuta la capacità di una macchina di esibire un comportamento intelligente indistinguibile da quello di un essere umano. In sostanza, se chi fa domande non riesce a distinguere tra le risposte di una macchina e quelle di un essere umano, si dice che la macchina ha superato il test di Turing. Questo significa che la macchina è in grado di sostenere conversazioni con un essere umano in modo così naturale e realistico che l’interlocutore non può riconoscere se sta parlando con una persona o con una macchina.
Replicare le iterazioni umane
In questo contesto, lo studio si è concentrato sulla capacità o meno di CHATgpt di replicare le interazioni umane in modo sufficientemente convincente. Il gruppo di Jackson aveva anche un altro punto su cui concentrarsi: non cercava di valutare solo l’accuratezza delle risposte fornite dalla chatbot, ma mirava a misurare in modo scientifico i tratti della personalità dei chatbot e la loro somiglianza con quelli umani. Per raggiungere questo scopo, il team di ricerca ha coinvolto due modelli linguistici di OpenAI, GPT-3 e GPT-4, in giochi e test sulla personalità, affrontando argomenti di economia ed etica. Ad esempio, ha sottoposto i chatbot a giochi in cui dovevano prendere decisioni sfavorevoli per l’utente, simulando situazioni del mondo reale.
Risultati. Test superato o no?
Lo studio ha coinvolto 500 persone che hanno conversato con ChatGPT 4 e con un essere umano. Il 52% degli intervistati non è riuscito a distinguere la chatbot dall’umano. Nel caso specifico di ChatGPT-4, gli scienziati hanno confrontato le risposte del modello di linguaggio con quelle di oltre 100.000 individui di 52 diverse nazionalità. Le domande provenivano da un test standard chiamato OCEAN Big-5, utilizzato dagli psicologi per valutare la personalità umana. Sebbene ChatGPT-4 abbia superato il test, è stato giudicato scarso nel creare relazioni amichevoli.
ChatGPT è umano: sa conversare ma non è sempre affabile
Ma questo non è certo l’unico studio sull’argomnto e nemmeno quello definitivo visto il velocissimo progredire dell’AI. Un’analisi condotta dall’Università di Stanford ha rilevato che ChatGPT 4, pur mostrando una personalità sovrapponibile a quella umana, presenta una scarsa “affabilità”. In altre parole, il chatbot è in grado di sostenere conversazioni realistiche, ma non è molto incline a stabilire relazioni amichevoli o empatiche. Il superamento del test di Turing da parte di ChatGPT-4 rappresenta un passo avanti significativo nello sviluppo dell’intelligenza artificiale. La capacità di sostenere conversazioni realistiche e indistinguibili da quelle umane è un traguardo importante, che apre nuove possibilità per l’interazione uomo-macchina. Detto questo, la scarsa affabilità di ChatGPT-4 evidenzia come l’IA abbia ancora molta strada da fare prima di raggiungere una vera e propria intelligenza sociale.