IA: funziona fino a che non ti serve davvero

by Rollo


IA: funziona fino a che non ti serve davvero

Esiste ancora una grande quantità di persone convinta che parlare a un modello di linguaggio significhi scrivere "sei un cuoco", "sei un analista finanziario", "comportati come un direttore commerciale" e aspettare che il travestimento produca competenza. È un errore, ma è l'errore visibile, quello che chiunque abbia scritto tre istruzioni in vita sua ha già imparato a riconoscere, qui la cosa interessante comincia dopo, quando si crede di averlo superato.

Perché contro il prompt generico esiste la reazione opposta, che sembra la sua cura e in realtà è una malattia più difficile da diagnosticare: il prompt enorme, stratificato, pieno di ruoli, framework, riferimenti, vincoli che dovrebbero operare tutti insieme. Chi lo costruisce è convinto di aver comprato precisione ma spesso ha comprato soltanto lunghezza. La differenza tra le due cose non si vede dall'esterno e non si vede nemmeno dall'interno di chi scrive, ed è qui che vale la pena fermarsi.

I due prompt falliscono in modi opposti e questo cambia tutto. Quello vago fallisce in modo rumoroso, ti restituisce una banalità generica che riconosci all'istante e siccome la riconosci la correggi, tanto che conosco una tizia che per questo motivo ha definito Gemini: "il cugino scemo di ChatGPT". Quello sofisticato invece fallisce in silenzio. Quando le istruzioni si accumulano oltre una certa soglia, il modello non le applica tutte: ne tiene alcune, ne lascia cadere altre, risolve da solo le contraddizioni che tu non ti sei accorto di aver scritto e ti consegna un risultato che adotta il registro del tuo framework. Suona competente perché è costruito con i tuoi materiali, cita i riferimenti che gli hai dato, rispetta il tono che hai chiesto, usa il vocabolario giusto e proprio per questo passa la tua verifica. E qui il punto non è teorico e chi ha misurato il fenomeno ha mostrato che la degradazione non nasce tanto dalla lunghezza in sé, quanto dalla tensione che cresce tra le istruzioni mano a mano che le aggiungi e il fatto che i modelli faticano a scartare l'informazione irrilevante anche quando sarebbero capaci di identificarla. Più l'impianto è ricco, più i suoi errori si vestono bene.

C'è una conseguenza che la maggior parte delle persone non vede ed è, ovviamente, la più scomoda. Chi scrive "sei un cuoco" almeno sa che il suo prompt sta facendo poco ma chi costruisce la cattedrale di istruzioni viene ingannato dalla propria stessa sofisticazione, sicuro di aver ottenuto rigore quando ha ottenuto volume. Il primo errore è onesto, ti guarda in faccia. Il secondo è mimetico e un errore che si traveste bene è peggiore di un errore goffo, perché supera esattamente i controlli che hai messo in piedi per fermarlo. La verifica diventa complice della cosa che dovrebbe intercettare.

Dentro tutto questo opera un meccanismo ancora più stretto, che si vede meglio tornando al ruolo. Quando dico a un modello "agisci come direttore commerciale", non gli sto trasmettendo la conoscenza di cosa fa un direttore commerciale. Gli sto cedendo l'autorità di stabilire cosa quel ruolo significhi. Se io quella conoscenza non ce l'ho, qualunque cosa il modello produca mi sembrerà giusta, perché non possiedo il metro per dire che è sbagliata. Il ruolo funziona, ma funziona solo nel caso in cui saprei già correggere il risultato da solo, ovvero nel caso in cui il ruolo mi serviva meno. Dove avrei davvero bisogno di delegare, lo strumento è cieco e dove non ne ho bisogno, vede benissimo. È una verifica che abdica a sé stessa nel momento esatto in cui la chiami in causa.

Da qui nasce un'illusione più larga, che riguarda chi con questi strumenti ci lavora ogni giorno e ci diventa fluente. La fluenza con un singolo modello, la capacità di ottenere risposte alte da una macchina che hai imparato a conoscere, somiglia moltissimo a una competenza generale ma non lo è per forza. Si può diventare bravissimi a parlare una lingua privata, fatta del proprio modo di chiedere e del modo specifico di rispondere di quel modello e scambiare quella fluenza per padronanza. Il test vero non è la risposta brillante che ottieni nella stanza dove sei di casa ma un modello che non hai mai usato, un compito in cui non sai già giudicare l'output, qualcuno che guarda le tue richieste senza sapere cosa volevi e prova a indovinarlo. È lì che si separa l'abilità trasferibile dalla confidenza di chi ha solo fatto molte ore nello stesso posto. E la confidenza, a differenza dell'abilità, cresce indisturbata proprio mentre il terreno sotto si restringe.

Iscriviti alla newsletter The Clinical Substrate

Ogni venerdì, pattern recognition attraverso i layer che altri non vedono.