2026 22 maggio

Controlli interni - Internal Controls

L’AI può provocare crisi finanziarie? La BCE lancia un avvertimento

Immaginate migliaia di algoritmi che gestiscono fondi di investimento. Tutti autonomi, tutti con lo stesso obiettivo: massimizzare il rendimento. Nessuno di loro sta “comunicando” con gli altri. Eppure, in pochi secondi, decidono tutti di vendere contemporaneamente — innescando una crisi che forse non sarebbe mai avvenuta in tempi così rapidi e con una tale magnitudo se avessero ragionato come esseri umani.

Non è fantascienza. È esattamente ciò che emerge da un recente studio della Banca Centrale Europea, pubblicato il 21 maggio 2026 (Research Bulletin n. 143).

La domanda che nessuno si stava ancora ponendo

Il dibattito sull’intelligenza artificiale in finanza si è finora concentrato soprattutto su cosa fanno gli algoritmi: come selezionano i titoli, come valutano il rischio, come interagiscono con i clienti. La BCE ha scelto di fare un passo indietro e porsi una domanda più profonda: come sono costruiti questi algoritmi? E la costruzione stessa, la loro architettura, può essere una fonte di instabilità? La risposta, in sintesi, è sì.

Due famiglie di AI, due modi di “pensare”

Per capire cosa ha scoperto la BCE, è utile fare un passo indietro e capire come funzionano, concretamente, questi due tipi di intelligenza artificiale.

Gli algoritmi di Q-learning: imparare dall’esperienza

Il Q-learning è una forma di apprendimento per rinforzo. Funziona in modo sorprendentemente simile a come impariamo noi da bambini: prova, sbaglia, riceve un segnale di “premio” o “punizione”, aggiusta il comportamento, riprova. Nel tempo, l’algoritmo costruisce una mappa interna delle situazioni possibili e delle azioni più convenienti in ciascuna di esse — quella che i tecnici chiamano una Q-table, una tabella di valori che associa ogni coppia “situazione-azione” a un rendimento atteso.

La "Q" sta per quality — qualità. In termini tecnici, Q è una funzione matematica che misura la qualità attesa di una certa azione in una certa situazione: quanto vale, in termini di rendimento futuro, fare quella cosa adesso.

Come funziona concretamente

L'algoritmo costruisce nel tempo una tabella — la Q-table — che associa ogni coppia possibile (situazione, azione) a un valore numerico. Per esempio:

(mercato in calo, vendi) → Q = 0.8
(mercato in calo, tieni) → Q = 0.2
(mercato stabile, vendi) → Q = 0.3
(mercato stabile, tieni) → Q = 0.7

Ad ogni ciclo, l'algoritmo sceglie l'azione con il Q più alto, osserva il risultato, e aggiorna i valori di conseguenza. Con il tempo, la tabella diventa sempre più precisa — o almeno, sempre più precisa rispetto alle esperienze che l'algoritmo ha vissuto.

Perché si chiama "learning"

Perché quei valori non sono programmati a mano: emergono dall'esperienza. L'algoritmo parte da zero, o quasi, e impara aggiornando la Q-table ogni volta che riceve un segnale di premio o punizione dall'ambiente. È la stessa logica del condizionamento operante studiato in psicologia — Pavlov, Skinner — applicata a un sistema matematico.

La radice teorica

Il Q-learning è stato formalizzato da Christopher Watkins nel 1989, nella sua tesi di dottorato a Cambridge. L'idea centrale era dimostrare che un agente poteva imparare la strategia ottimale in un ambiente incerto senza conoscerne le regole in anticipo — solo osservando le conseguenze delle proprie azioni. È uno dei pilastri del reinforcement learning, la branca del machine learning in cui un agente impara interagendo con un ambiente, anziché da un dataset statico.

Il punto debole, in una frase

La Q-table registra cosa è successo, non perché è successo. L'algoritmo non ha accesso alle cause — solo alle correlazioni tra azioni e risultati. Ed è esattamente per questo che, come mostra lo studio BCE, può imparare la lezione sbagliata nel momento sbagliato.

Nel contesto finanziario, questo significa che un algoritmo QL impara a comprare o vendere sulla base di ciò che ha “vissuto” in passato: se in situazioni simili la vendita ha prodotto rendimenti migliori, la vendita diventerà la sua risposta preferita. Non ragiona sul perché, tende a replicare, se non corretto, ciò che ha funzionato nel passato, più o meno recente.

Il punto critico è che questo apprendimento è locale e storico: l’algoritmo non ha accesso a una visione d’insieme del mercato, non valuta le intenzioni degli altri operatori, non ragiona su scenari futuri. Quando molti algoritmi simili hanno imparato le stesse lezioni nello stesso ambiente, tendono a sviluppare le stesse risposte — con effetti paralleli e potenzialmente rischiosi se quelle risposte non sono accurate.

I Large Language Models: ragionare sul contesto

Gli LLM funzionano in modo diverso. Non imparano dall’esperienza diretta nel senso del reinforcement learning: sono stati addestrati su enormi quantità di testi, dai quali hanno estratto pattern linguistici, concetti, relazioni logiche. Quando devono prendere una decisione, ragionano sul contesto che viene fornito nel momento, applicando le strutture concettuali apprese durante l’addestramento.

In finanza, questo si traduce in un comportamento molto più simile a quello di un analista umano: l’LLM legge le informazioni disponibili, valuta i segnali macroeconomici, considera le possibili reazioni degli altri investitori, e formula una risposta coerente. Non è condizionato da episodi traumatici passati e, se i fondamentali sono solidi, mantiene in essere gli investimenti di portafoglio.

Il limite, però, emerge proprio nella sua forza: quando il contesto è particolarmente ambiguo, la teoria economica non offre una risposta univoca e, in questi casi, LLM identici che ricevono le stesse informazioni possono costruire aspettative diverse e agire in modo divergente. Non è un errore del modello: è la fedele riproduzione dell’indeterminatezza che caratterizza certi equilibri economici.

Una differenza che conta

In sintesi: il QL è pericoloso dato che troppo coordinati tra loro e, quindi, trascinare tutti nella direzione sbagliata (e, come risulta dalla nota BCE, farlo con molto anticipo rispetto agli LLM). Gli LLM, invece, sono pericolosi perché non sono coordinati tra loro e, proprio per questo, generano molto rumore e instabilità nei momenti in cui il mercato avrebbe più bisogno di segnali chiari. Due architetture, due profili di rischio speculari.

Il paradosso degli algoritmi che “imparano”

Gli algoritmi di reinforcement learning si sono rivelati straordinariamente bravi a coordinarsi. Il problema è che questa coordinazione può portarli a fare tutti la stessa cosa, secondo BCE, nel momento sbagliato (ed a farla prima degli LLM).

Il meccanismo si chiama “hot stove effect” — l’effetto della stufa bollente. Se un algoritmo ha vissuto episodi in cui rimanere investito ha prodotto perdite, finirà per associare “rimanere investito” a qualcosa di pericoloso. E quando centinai di algoritmi simili hanno imparato la stessa lezione, il risultato è una fuga collettiva dal mercato — anche quando i fondamentali economici sono solidi e non giustificano alcuna vendita. Una sorta di panico di massa generata da macchine, senza che nessuna di esse abbia “deciso” di farlo.

Gli LLM: meno panico, ma più imprevedibili

I Large Language Models non soffrono di questo problema. Non avendo memoria degli episodi passati nel senso del reinforcement learning, non sviluppano paure condizionate. Quando i dati economici sono positivi, semplicemente non vendono.

Ma hanno un’altra vulnerabilità: l’imprevedibilità. Quando il contesto è ambiguo, LLM identici che ricevono le stesse informazioni possono arrivare a conclusioni opposte. Uno si aspetta che gli altri vendano, e quindi vende. Un altro si aspetta che gli altri restino, e quindi resta. Il risultato è caos, non panico.

La buona notizia è che questa imprevedibilità ha un antidoto: se si è capaci di fornire a ciascun algoritmo piccoli segnali informativi privati, anche imprecisi, tali segnali sono sufficienti ad allineare le aspettative e stabilizzare il comportamento collettivo.

Cosa cambia per banche e regolatori

Lo studio non è solo un esercizio teorico. Contiene implicazioni concrete per chiunque operi nel sistema finanziario.

• per le banche: non basta sapere se si usa l’AI — occorre capire che tipo di AI si usa e quali rischi sistemici può generare la sua architettura. Un algoritmo di trading basato su reinforcement learning e uno basato su LLM non sono equivalenti dal punto di vista del rischio, anche se puntano allo stesso obiettivo;

• per i supervisori: la BCE apre una strada precisa — i framework di vigilanza dovranno incorporare la valutazione della competenza tecnologica degli intermediari e, forse, persino dei clienti, accanto ai tradizionali indicatori di rischio finanziario;

• per il mercato: strumenti come i circuit breaker potranno diventare ancora più rilevanti nell’era dell’AI, per contenere disinvestimenti eccessivi nelle fasi di turbolenza.

I circuit breaker sono meccanismi automatici che interrompono temporaneamente le contrattazioni quando i prezzi si muovono troppo velocemente in un breve arco di tempo. Il mercato può avere bisogno di una pausa forzata quando il panico — umano o algoritmico — rischia di trasformare un movimento brusco in un crollo incontrollato. Il circuit breaker è esattamente questo: un fusibile. Scatta, ferma tutto, e dà al mercato il tempo di "respirare" prima che la spirale diventi irreversibile.

Le soglie variano per mercato, ma il meccanismo tipico prevede livelli progressivi. Alla Borsa di New York (NYSE), per esempio:

Calo del 7% sull'S&P 500 → stop di 15 minuti
Calo del 13% → secondo stop di 15 minuti
Calo del 20% → chiusura della sessione per il resto della giornata

Esistono anche a livello di singolo titolo: se un'azione si muove troppo in poco tempo, le contrattazioni su quel titolo vengono sospese per qualche minuto.

La spinta decisiva arrivò dopo il Black Monday del 19 ottobre 1987, quando il Dow Jones perse il 22% in un solo giorno — il peggior crollo percentuale giornaliero della storia. L'indagine successiva rivelò che i sistemi di trading automatico dell'epoca avevano amplificato il panico vendendo in modo coordinato e incontrollato. I circuit breaker furono introdotti proprio per evitare che si ripetesse.

Furono poi aggiornati e resi più sofisticati dopo il Flash Crash del 6 maggio 2010, quando in pochi minuti l'indice perse quasi il 10% per poi recuperare quasi tutto entro la stessa giornata — un evento causato in larga parte da algoritmi di trading ad alta frequenza.

Uno degli interrogativi aperti dallo studio è proprio se le soglie e i tempi attuali dei circuit breaker siano ancora adeguati a un mercato in cui una frazione crescente delle decisioni è presa da macchine che imparano, coordinano e reagiscono molto più velocemente di qualsiasi operatore umano.

Perché questo conta oggi

L’AI gestisce già il 60-70% dei volumi azionari negli Stati Uniti e nei principali mercati globali. I sistemi agentici — capaci di eseguire autonomamente compiti complessi con supervisione umana minima — stanno per fare il loro ingresso su larga scala nel settore finanziario.

“Ciò ha implicazioni per tutti i soggetti interessati, dagli investitori al dettaglio alle autorità di regolamentazione. Poiché la comprensione degli strumenti di intelligenza artificiale e della loro architettura sottostante diventa sempre più importante per prendere decisioni finanziarie consapevoli, gli investitori al dettaglio potrebbero aver bisogno di competenze tecnologiche, oltre a quelle finanziarie.

Gli intermediari finanziari potrebbero aver bisogno di sapere se e come i loro clienti utilizzano gli strumenti di intelligenza artificiale nell'ambito della gestione del rischio.

E le autorità di vigilanza potrebbero dover integrare indicatori di competenza tecnologica nei quadri normativi a tutela degli investitori, accanto a indicatori tradizionali come la propensione al rischio e le conoscenze finanziarie, ad esempio nei questionari richiesti dalla Direttiva sui mercati degli strumenti finanziari (MiFID).”

Possiamo ragionarne insieme

Se stai valutando come posizionare la tua SGR o SIM rispetto ai rischi AI che i regolatori europei stanno già mappando, Studio Balestreri supporta gli intermediari finanziari nell’analisi delle implicazioni regolamentari dell’AI, nella strutturazione dei presidi di governance e nel dialogo con la supervisione.

Scrivimi a ab@studiobalestreri.it o collegati su LinkedIn.

Alberto Balestreri è fondatore di Studio Balestreri, società di consulenza milanese specializzata in governance, controlli interni e regolam