la sfida a OpenAI e microsoft

Google lancia Gemini, l’assistente AI più potente e efficiente di chatGPT? (Benchmark e video “fake”)

di |

È un assistente vocale multimodale, comprende e combina testo, video, audio, immagini e codici. Indovina il gioco delle 'tre campanelle' fino ad essere di aiuto nei libri scientifici. ChatGPT non è più unico. Ma siamo già al plateau dei large language model?

Google sfida OpenAI e Microsoft. Ha lanciato Gemini, che secondo i benchmark forniti da big G, è più potente ed efficiente di GPT-4, l’ultima versione avanzata di ChatGPT.

Guardate cosa fa. *Aggiornamento. Alcuni giorni dopo la pubblicazione di questo video, Google è stata costretta ad ammettere, perché scoperto da ricercatori esterni alla società, che il video è un fake. Nel senso, quello che viene mostrato non è avvenuto in tempo reale. I prompt che sono sentiamo, in realtà sono stati indicati via testo a Gemini, che in generale ha ricevuto più indicazioni rispetto a quelle presenti nel video per fornire le risposte. In sostanza, anche lui si basa sul testo come ChatGPT. E per le immagini è stato sollecitato da fotogrammi, non da immagini/video in tempo reale. Ecco la spiegazione ufficiale di Google su come sono andate realmente le cose.

È un assistente vocale multimodale, comprende e combina testo, video, audio, immagini e codici. È pazzesco: indovina il gioco dei tre campanelli fino ad essere di aiuto nei libri scientifici.

La sua notevole capacità, spiega Google, di estrarre informazioni da centinaia di migliaia di documenti attraverso la lettura, il filtraggio e la comprensione dei contenuti contribuirà a fornire nuove scoperte a velocità digitale in molti campi, dalla scienza alla finanza.

Gemini e GPT-4, il confronto. Dai Benchmark forniti da Big G stravince sempre il nuovo sistema AI di Google

Coding avanzato

La prima versione di Gemini può comprendere, spiegare e generare codice di alta qualità nei linguaggi di programmazione più popolari al mondo, come Python, Java, C++ e Go. La sua capacità di lavorare tra i linguaggi e ragionare su informazioni complesse lo rende uno dei principali modelli di base per la codifica nel mondo.

Gemini in tre versioni, dal 13 dicembre prossimo si potrà testare

Gemini, disponibile in tre versioni. Gemini Ultra, la categoria più grande e capace, sarà il primo modello a superare gli esperti umani in MMLU (massive multitask Language Understanding) e utilizzerà una combinazione di 57 materie come matematica, fisica, storia, diritto, medicina ed etica. Gemini Pro si adatterà a un’ampia gamma di attività e Gemini Nano sarà utilizzato per compiti specifici e dispositivi mobili. La società prevede di concedere Gemini in licenza ai clienti tramite Google Cloud affinché possano utilizzarlo nelle proprie applicazioni. A partire dal 13 dicembre, sviluppatori e clienti aziendali potranno accedere a GeminiPro tramite l’API Gemini in Google AI Studio o Google Cloud Vertex AI. Gemini verrà utilizzato anche per potenziare prodotti Google come il chatbot Bard, rivale di ChatGPT, e Search Generative Experience.

Considerazioni

Gemini dimostra che chatGPT non è più unico. Non è stato spazzato via, ma non è più il più potente sistema di AI generativa. Alcuni esperti si chiedono se siamo già giunti al plateau dei large language model? Visto che GPT-5 non è nato dopo un anno dalla nascita di chatGPT e visto che Google, con le stesse risorse di Microsoft-OpenAI, non abbiamo spazzato del tutto chatGPT con il suo Gemini.