Meta lancerà il suo modello di intelligenza artificiale di prossima generazione Llama 3 nel mese di luglio di quest’anno. Sarà un’alternativa completamente open source all’egemonia di GPT-4 di OpenAI e Gemini di Google.
Segnalata da diversi siti web di informatica, la nuova versione della popolare famiglia di modelli Llama è entrata in fase di creazione dallo scorso anno. La spinta a procedere è stata data da Meta stessa, che intende creare un’AI super intelligente.
Secondo alcune fonti, Llama 3 fornirà risposte migliori a domande su argomenti controversi come la razza o l’uguaglianza rispetto ai sistemi chiusi costruiti da OpenAI e Google o rispetto a Llama 2, la versione del modello rilasciato da Meta l’anno scorso.
Fino a che punto si spingerà Meta non è al momento chiaro. Però, secondo un rapporto, gli alti dirigenti ritengono che i paletti imposti sulla versione precedente la rendessero “troppo sicura”.
Cosa renderà Llama 3 diverso?
Llama 3 è un modello linguistico di grandi dimensioni, proprio come Gemini, Mistral Large o GPT-4. Ciò che non sappiamo è esattamente quali capacità avrà il nuovo modello o le sue dimensioni.
Ciò che è probabile rispetto alle versioni precedenti di Llama è che Meta offrirà un’ampia gamma di dimensioni. L’intento è di rendere facile per gli sviluppatori di terze parti riqualificarsi, mettere a punto e costruire sul modello base.
Tuttavia, avrà ancora dei paletti. Questo a causa della crescente pressione da parte dei regolatori e dei governi nazionali sulla sicurezza dell’IA, inclusa la nuova legge sull’intelligenza artificiale dell’Unione Europea.
Secondo un documento informativo, i ricercatori di Meta stanno lavorando su come “allentare” Llama 3 rispetto alle generazioni precedenti pur mantenendo la sicurezza generale.
Ciò va contro alcuni sforzi di altre società di aggiungere rigidi paletti attorno ad argomenti controversi. Google, ad esempio, è stata costretta a disabilitare la capacità di Gemini di creare immagini di persone dopo aver interpretato in modo eccessivo le istruzioni sulla diversità.
Apparentemente Meta sta cercando di fornire almeno il contesto attorno alla query piuttosto che ignorarla o rimproverare l’utente per aver posto la domanda.
Perché Llama è un grosso problema?
Llama 2, il modello linguistico di grandi dimensioni della generazione precedente di Meta. Attualmente viene utilizzato nei prodotti dell’azienda per potenziare gli strumenti di intelligenza artificiale conversazionale. Così come in una serie di altre piattaforme, incluso GroqChat, poiché è open source.
Essendo un modello aperto, significa anche che può essere eseguito localmente su un laptop o anche su un telefono. Esistono strumenti come Ollama o Pinokio che rendono tutto ciò relativamente facile da realizzare. È possibile interagire con esso, eseguendo interamente sul computer, un po’ come accade con ChatGPT, ma offline.
Per Meta, Llama è fondamentale. Fa parte delle ambizioni del colosso dei social media rendere l’intelligenza artificiale più utile. Infatti, si parla di espandere l’assistente Meta AI e costruire modelli super intelligenti in grado di comprendere il mondo reale e il modo in cui interagiamo con esso.
Si prevede che sarà molto più grande di Llama 2 con più di 100 miliardi di parametri; non è ancora però chiaro se sarà multimodale e quindi in grado di comprendere e analizzare immagini, video e testo.
Come sta affrontando Meta la questione del tono?
Meta sta progettando di assumere qualcuno per supervisionare il tono e l’addestramento sulla sicurezza di Llama prima del rilascio. Questo non servirà a impedirgli completamente di rispondere. L’obiettivo è aiutarlo a diventare più sfumato nelle sue risposte e ad assicurarsi che faccia di più che dire “Non posso aiutarti con quella domanda”.
Non si tratta solo di risolvere gli argomenti più controversi, ma anche altri argomenti di conversazione.
La tempistica del rilascio potrebbe ancora cambiare, ma luglio sembra avere un senso in base ai programmi precedenti. Ci aspettiamo anche una nuova versione di GPT-4 di OpenAI quest’anno e forse l’arrivo di GPT-5.