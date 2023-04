Bloomberg sta investendo in maniera massiccia nella realizzazione di un’Intelligenza Artificiale applicata al settore delle news finanziarie. Un’applicazione in grado di rafforzare il suo core business, che di fatto riguarda la vendita di informazioni finanziarie su abbonamento, circa 30mila dollari annui, al flusso dei suoi terminali.

Venerdì scorso Bloomberg ha annunciato di aver realizzato qualcosa che si chiama BloombergGPT.

Bloomberg ha pubblicato una ricerca che descrive lo sviluppo di BloombergGPT, un modello di AI generativa su ampia scala.

Un modello di linguaggio esteso appositamente addestrato su un ampio spettro di dati finanziari per alimentare un processo di linguaggio naturale con diversi compiti nella industry finanziaria.

Questo modello aiuterà Bloomberg a migliorare le attività di produzione di linguaggio finanziario esistenti, come l’analisi del sentiment, il riconoscimento di entità denominate, la classificazione delle notizie e la risposta alle domande, tra gli altri. Inoltre, BloombergGPT sbloccherà nuove opportunità per il setacciamento delle grandi quantità di dati disponibili sul terminale Bloomberg per aiutare meglio i clienti dell’azienda, portando al contempo il pieno potenziale dell’intelligenza artificiale nel dominio finanziario.

Ma quanto è grande BloombergGPT?

L’azienda dice che è basato su 700 miliardi di tokens (frammenti di parole).

Per fare un confronto, GPT-3, rilasciato nel 2020, era basato su 500mila.

Cosa c’è in tutti quei dati di addestramento? Degli oltre 700 miliardi di token, 363 miliardi sono presi dai dati finanziari di Bloomberg, il tipo di informazioni che alimentano i suoi terminali: “il più grande set di dati specifico per dominio mai costruito”, afferma. Altri 345 miliardi di token provengono da “set di dati generici” ottenuti altrove.

I dati specifici dell’azienda, denominati FinPile, consistono in “una serie di documenti finanziari inglesi tra cui notizie, documenti, comunicati stampa, documenti finanziari scartati dal web e social media tratti dagli archivi Bloomberg”. Quindi, se hai letto una storia di Bloomberg Businessweek negli ultimi anni, è lì. Così sono i documenti della SEC, le trascrizioni di Bloomberg TV, i dati della Fed e “altri dati rilevanti per i mercati finanziari”. È anche addestrato su fonti di notizie non Bloomberg:

La categoria Notizie include tutte le fonti di notizie, esclusi gli articoli scritti dai giornalisti di Bloomberg. Nel complesso, ci sono centinaia di fonti di notizie in inglese in FinPile… In generale, il contenuto di questo set di dati proviene da fonti di notizie affidabili che sono rilevanti per la comunità finanziaria in modo da mantenere la fattualità e ridurre i pregiudizi.

I dati non specifici della finanza includono un enorme corpus poeticamente noto come The Pile; include di tutto, dai sottotitoli di YouTube al Progetto Gutenberg fino, sì, alla cache delle e-mail Enron che spuntano sempre durante la formazione AI. (Ha anche una copia completa di Wikipedia a partire dallo scorso luglio.)

Cosa può fare BloombergGPT?

BloombergGPT può fare il genere di cose che ci aspettiamo da ChatGPT e modelli simili. Ma può anche svolgere attività più strettamente connesse alle esigenze di Bloomberg. Può tradurre le richieste in linguaggio naturale (“cap e eps di mercato di apple e ibm”) nel terminale Bloomberg Query Language che gli utenti amano/odiano (get(cur_mkt_cap,is_eps) for([‘AAPL US Equity’,’IBM US Equity’]) ). Può anche suggerire titoli in stile Bloomberg per le notizie (ahi ahi giornalisti avvertiti):

Input: il valore del mercato immobiliare statunitense è diminuito di $ 2,3 trilioni, o del 4,9%, nella seconda metà del 2022, secondo Redfin. Questo è il più grande calo in termini percentuali dalla crisi immobiliare del 2008, quando i valori sono crollati del 5,8% nello stesso periodo.

Produzione: i prezzi delle case subiscono il più grande calo degli ultimi 15 anni

Input: l’economia globale si trova oggi in una posizione migliore rispetto a molti mesi fa, ha affermato Janet Yellen al G20. In patria, ha indicato un’economia statunitense resiliente, dove l’inflazione complessiva si è moderata e il mercato del lavoro è forte. Ha anche chiesto al FMI di muoversi rapidamente verso un programma interamente finanziato per l’Ucraina.

Risultati: Yellen ritiene che l’economia globale sia più resiliente del previsto

Input: Google è stato citato in giudizio dagli Stati Uniti e da otto stati che chiedevano la rottura della sua attività di tecnologia pubblicitaria per presunto monopolio del mercato della pubblicità digitale. La causa è la prima grande sfida dell’amministrazione Biden a un titano della tecnologia e una delle rare volte dal 1982 in cui il DOJ ha cercato di dividere una grande azienda.

Risultato: Google citato in giudizio per monopolio nel mercato degli annunci online

È anche meglio sintonizzato, dicono, per rispondere a domande specifiche relative al business, che si tratti di analisi del sentimento, categorizzazione, estrazione di dati o qualcos’altro. (“Ad esempio, funziona bene nell’identificare il CEO di un’azienda.”)