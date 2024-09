La scorsa settimana, OpenAI ha lanciato la sua ultima intelligenza artificiale, o1, definendola un “modello di ragionamento” con capacità di risoluzione dei problemi simili a quelle umane. Sebbene sia ancora in anteprima limitata, OpenAI afferma che o1 è molto più efficace nei compiti complessi grazie a una “catena di pensiero” interna che gli permette di suddividere i problemi in fasi, autocorreggersi e perfezionare il suo approccio.

La ricerca e i test dimostrano che o1 supera i modelli precedenti in codifica, matematica e vari campi scientifici. Tuttavia, il suo funzionamento interno rimane un mistero, con OpenAI che rivela poco sulla sua costruzione. Nonostante il marketing, non è chiaro se o1 offrirà un’esperienza radicalmente nuova o un miglioramento incrementale. Un aspetto importante è il costo: ogni parola prodotta da o1 è circa quattro volte più costosa di GPT-4o, evidenziando le crescenti spese legate all’AI generativa. Inoltre, il tempo di elaborazione più lungo di o1 solleva interrogativi sulla sua redditività futura.

Quanto è “umano” Gpt-o1?

OpenAI e altri nel settore hanno deciso di seguire un trend chiaro nel particolare contesto dell’AI: proporre modelli plasmati sulle capacità umane, descrivendoli come dotati di “carattere”, “mente” e capacità di “ragionamento”. La start-up Anthropic ha descritto il suo modello, Claude, come dotato di “carattere” e “mente”. Google decanta le capacità di “ragionamento” della sua IA ; la start-up di ricerca di IA Perplexity afferma che l’omonima piattaforma che sviluppa “capisce” il mondo.

Una strategia che sembra nata per vendere un prodotto il cui valore è difficile da definire. Del resto, paragonare l’AI al ragionamento umano solleva interrogativi sull’accuratezza e sull’etica di tale paragone. Sebbene il linguaggio dell’umanità possa essere allettante, è importante ricordare che ogni mente è unica e che l’intelligenza artificiale, per quanto avanzata, opera in modo fondamentalmente diverso dal cervello umano.

Catena di ragionamento

Progettato espressamente per richiedere più tempo nel rispondere, o1 consuma necessariamente più risorse, aumentando a sua volta la posta in gioco sul fatto se l’AI generativa possa essere redditizia, se mai lo sarà. Forse la conseguenza più importante di questi tempi di elaborazione più lunghi non sono tanto i costi tecnici o finanziari quanto piuttosto una questione di branding. I modelli di “ragionamento” con “catene di pensiero” che necessitano di “più tempo” non sembrano roba da laboratori di informatica, a differenza del linguaggio esoterico di “trasformatori” e “diffusione” utilizzato in precedenza per modelli di testo e immagini.

Ma vendere il ragionamento umano, uno strumento che pensa come te, insieme a te, è diverso, roba da letteratura anziché da laboratorio. Il linguaggio non è, ovviamente, più chiaro di qualsiasi altra terminologia dell’IA, e se non altro è meno preciso: ogni cervello e la mente che supporta sono completamente diversi, e paragonare in generale l’IA a un essere umano potrebbe dimostrare un malinteso sull’umanesimo.

Sempre, gli stessi, errori

Considerare l’AI in grado di ragionare non la pone in una situazione privilegiata rispetto alle persone, anzi solleva ulteriori dubbi sull’affidabilità “certa” di un modello. Su X, l’ingegnere del software Zach Nagengast ha spiegato di aver usato o1 per “chiedere di ottimizzare il codice usando un algoritmo specifico. Inizialmente l’AI ha prodotto un errore, poi ha tentato di fornire una correzione, quindi ha semplicemente passato al vecchio codice nello stesso output”.

Fascinating new behavior in o1-preview: it is smart enough to give up.



When asked to optimize code using a specific algorithm and initially producing an error, it attempted to provide a fix, then simply passed back to the old code in the same output. Careful copy-pasting folks! pic.twitter.com/capT0BDvzF — Zach Nagengast (@zachnagengast) September 12, 2024

C’è poi chi si è accorto che, nel fornire una risposta, o1 non corregge quello che scrive, quando capisce di aver sbagliato, ma modifica il contesto facendo credere all’utente umano di aver posto in modo errato la questione.

One of the things we saw with GPT-4's function calling is the concept of "positive hallucinations" where the model decides it knows better and returns the correct result regardless. We see something similar happening here in OpenAI o1 in its reasoning steps where it… pic.twitter.com/UM05h8VZEw — Yi Ding — prod/acc (@yi_ding) September 12, 2024

Se non è un modo per ingannare le persone è sicuramente una mossa con cui costruire una società a proprio piacimento. Stravolgendo quello in cui abbiamo sempre creduto.

