Distillazione AI è il nome tecnico, ma il nome morale è rubare

Oggi vi spiego cosa è la Distillazione AI, perché fa così tanto paura agli Americani (e non solo), perché i cinesi la usano a mani basse per produrre AI veloci, economiche e precise sfruttando i grandi modelli. Ma vi spiego anche quanta ipecrisia becera c’è dietro le lacrime di Anthropic e perché questa cosa dovrebbe farvi arrabbiare. Tanto.
Antefatto: come sapete insegno sicurezza dei sistemi di intelligenza artificiale in università, e ai miei studenti ripeto sempre che nel digitale le parole non descrivono i fatti, li incorniciano per definirli. È il costruttivismo narrativo, la base di una intera carriera e delle mie aziende, quel concetto che dice che “la Realtà è un oggetto socialmente negoziato”, e questo ne è un caso da manuale.

A settembre 2025 Anthropic, il laboratorio che produce Claude e che si presenta al mondo come l’azienda di intelligenza artificiale “dei buoni”, quella ossessionata dalla sicurezza e dall’allineamento etico, ha accettato di versare 1,5 miliardi di dollari per chiudere una class action degli autori americani: aveva scaricato qualcosa come sette milioni di libri da archivi pirata per dare in pasto a Claude la prosa dell’umanità. Pochi mesi dopo, a febbraio 2026, la stessa Anthropic ha puntato il dito contro tre laboratori cinesi accusandoli, con un comunicato e con i numeri, di averle sottratto il modello. Il verbo usato dalla stampa e dall’azienda è sempre lo stesso: theft (Trad. “furto”). L’accusa, di per sé, conta poco; conta che la stessa parola, nello stesso anno, descriva due gesti quasi identici e li giudichi in modo opposto.

Per capire perché conviene partire dalla parola tecnica che sta in mezzo a tutto questo, una parola che fino a due anni fa conoscevano solo gli addetti ai lavori e che oggi è diventata un’arma retorica: distillazione.

Che cosa vuol dire “distillare” un modello

La distillazione, in apprendimento automatico, nasce come una cosa nobile e perfino incredibilmente elegante. La formalizzano nel 2015 tre ricercatori di Google, Geoffrey Hinton (lo ricordate forse con l’appellativo di “il papà della AI”), Oriol Vinyals e Jeff Dean, in un articolo dal titolo quasi poetico, Distilling the Knowledge in a Neural Network (Trad. “Distillare la conoscenza in una rete neurale”). L’idea di base è di una semplicità quasi disarmante: hai un modello enorme, costosissimo, lento, che però è molto, molto bravo; vuoi un modello piccolo, economico, veloce, che sia quasi altrettanto bravo ma costi meno a fare girare. Tipico problema di botte piena e LLM ubriaco :). Allora prendi il modello grande, lo chiami “maestro”, gli fai produrre un sacco di risposte, e addestri il modello piccolo, lo “studente”, a imitare qualcosa di più sottile del semplice verdetto giusto-sbagliato: le sfumature di probabilità con cui il maestro distribuisce la sua fiducia tra tutte le risposte possibili. Hinton lo chiamava, con una bella immagine che ho sempre trovato molto poetica, “conoscenza oscura”: la vera competenza non sta in quale sia la risposta, ma in quanto il maestro la preferisce alle alternative, ed è in quella gradazione che si nasconde il talento. Lo studente, imparando a imitare quelle sfumature, eredita una parte del talento del maestro a una frazione del costo.

Fin qui è una tecnica di compressione, roba da nerd brufolosi (evviva gli stereotipi!) e in casa propria è perfettamente lecita: se maestro e studente appartengono allo stesso laboratorio, zero problemi. Il problema nasce quando lo studente di un’azienda va a lezione, di nascosto, dal maestro di un’altra. Nella sua versione 2026, infatti, la distillazione di cui si parla è un’altra cosa: non hai accesso ai meccanismi interni del modello rivale, ma hai accesso alla sua bocca, cioè alla sua interfaccia pubblica a pagamento. Puoi “usarlo”, fare una sacco di domande, e sfruttarlo da maestro… Allora apri migliaia di account, bombardi il modello concorrente di domande, raccogli milioni di sue risposte, e con quel bottino addestri il tuo. È esattamente quello di cui Anthropic accusa DeepSeek, Moonshot AI e MiniMax: secondo l’azienda, dietro l’accusa ci sono 24.000 account fraudolenti e 16 milioni di scambi con Claude estratti per nutrire modelli cinesi, una campagna che Anthropic ha definito “su scala industriale”. Pochi mesi dopo, a giugno 2026, è arrivata l’accusa gemella contro il laboratorio Qwen di Alibaba: stando alle ricostruzioni di Inc. si parla di circa 25.000 account falsi e 28,8 milioni di scambi tra aprile e giugno, mirati alle capacità di scrittura di codice e ragionamento di Claude (questo secondo dato, attenzione, al momento poggia su una sola filiera di fonti, va preso con la prudenza che merita).

Tecnicamente, c’è una violazione: i termini di servizio di Anthropic, come quelli di OpenAI, vietano espressamente di usare gli output del modello per addestrare un modello concorrente. Su questo non si discute, è un contratto e lo si è infranto. C’è però un dettaglio che vale tutta la storia: nello stesso comunicato in cui accusa i cinesi, Anthropic ammette che la distillazione è “un metodo di addestramento ampiamente diffuso e legittimo”, salvo poi sostenere che i laboratori cinesi l’hanno usato “per scopi illeciti”. La tecnica, dunque, è la stessa e per ammissione dell’accusatore è perfino legittima: a cambiare è soltanto chi la impugna. Teniamo da parte questo punto e fermiamoci sulla sostanza di quel gesto, al netto del contratto. Distillare un modello via interfaccia significa, in fondo, imparare guardando cosa produce. Lo studente non copia il codice del maestro, non gli ruba i pesi della rete: osserva le sue uscite e ne assorbe lo stile, le competenze, i modi. Tenete a mente questa definizione, perché tra poco torna utile in modo quasi imbarazzante.

Il furto che sta a monte

Da dove viene, infatti, la bravura di Claude, il maestro derubato? Viene da una distillazione molto più grande e molto più antica, fatta sull’unico maestro che nessuno ha mai pagato: l’intera produzione scritta della specie umana. Per addestrare i suoi modelli Anthropic ha attinto, tra le altre fonti, a circa cinque milioni di libri scaricati da Library Genesis e ad altri due milioni circa dal Pirate Library Mirror, due tra i più noti archivi di testi piratati del pianeta. Lo sappiamo perché lo ha accertato un tribunale federale americano nella causa Bartz contro Anthropic, chiusa con quel patteggiamento da 1,5 miliardi di dollari annunciato a settembre 2025: secondo l’Authors Guild il risarcimento copre circa 500.000 titoli, attorno ai tremila dollari a libro, ed è la cifra più alta mai vista in una causa sul diritto d’autore.

La parte davvero istruttiva è la motivazione del giudice William Alsup, depositata a giugno 2025. Alsup ha tracciato una linea netta: addestrare un modello su libri acquisiti legalmente è, parole sue, “quintessentially transformative” (Trad. “trasformativo nella sua essenza”), e dunque rientra in quello che la legge americana chiama fair use (Trad. “uso lecito”); ma scaricare le copie pirata di quei libri è un’altra faccenda, ed è violazione pura e semplice del diritto d’autore. Tradotto: il problema, per la legge americana, non era imparare dai libri, era averli presi senza pagarli. Anthropic ha rastrellato il sapere scritto del mondo come fosse acqua di fiume, e ha trovato i fiumi più comodi negli archivi pirata.

A descrivere questo gesto con la massima precisione, anni prima che esistesse Claude, è stata Shoshana Zuboff nel suo The Age of Surveillance Capitalism (2019): il capitalismo digitale, scriveva con una premonizione quasi inquetante, e con le parole perfette per descrivere il fenomeno attuale (si vede perché la amo, vero?), che si fonda sulla “rivendicazione unilaterale dell’esperienza umana privata come materia prima gratuita”. La sua analisi riguardava i dati comportamentali, i click e gli scroll, ma la formula calza alla perfezione sui modelli linguistici: l’intero scibile umano trattato come materia prima gratuita, da estrarre, processare e rivendere sotto forma di capacità predittiva. Con una differenza che pesa: quando Anthropic distilla l’umanità, il tribunale parla di uso “trasformativo”; quando un cinese distilla Anthropic, l’azienda parla di furto. Comodo, vero?

Chi decide che cosa è un furto? La proprietà è furto?

Qui sta il cuore della questione, e non è un cuore ipocrita, è un cuore politico. Nel 1840 Pierre-Joseph Proudhon scriveva una delle frasi più fraintese del pensiero economico, “la propriété, c’est le vol” (Trad. “la proprietà è un furto”). Non invitava a rubare, eh! Osservava che ogni proprietà, alla sua origine, è un atto di appropriazione di qualcosa che prima non apparteneva a nessuno, e che solo dopo, col tempo e con la legge, diventa “naturale” e rispettabile. Il punto di Proudhon non è che rubare sia bello; è che la differenza tra l’appropriazione legittima e il furto non sta nel gesto, sta in chi ha il potere di nominarlo.

E qui le parole diventano armi. Provate a mettere in fila il vocabolario: quando l’azienda affermata estrae il sapere altrui, il gesto si chiama fair use, materia prima, innovazione, progresso, addestramento. Quando lo sfidante estrae il sapere dell’azienda affermata, lo stesso identico gesto si chiama furto, parassitismo, e nel caso cinese persino minaccia alla sicurezza nazionale: in un memo al Congresso americano, OpenAI ha accusato DeepSeek di “andare a sbafo sulle capacità sviluppate da OpenAI e dagli altri laboratori di frontiera americani”. Sbafo, free-ride nell’originale. La stessa operazione logica, l’imparare osservando le uscite di un sistema più capace, cambia nome a seconda di chi la compie e contro chi.

Il politologo Steven Lukes, in Power: A Radical View (1974), descriveva tre livelli del potere. Il primo è vincere i conflitti aperti; il secondo è decidere di cosa si discute e cosa resta fuori dal tavolo; ma il terzo, la terza faccia del potere, è il più profondo: è la capacità di plasmare le percezioni a monte, così che certe cose appaiano ovvie, naturali, fuori discussione, e nessun conflitto nasca affatto. Il potere più grande non è vincere la causa sul furto, è far sì che il tuo prelievo non venga mai chiamato furto da nessuno. È esattamente la condizione che Antonio Gramsci, nei Quaderni del carcere, chiamava egemonia: il dominio non si regge sulla forza, si regge sulla capacità di trasformare la propria visione del mondo nel senso comune di tutti, anche dei dominati. “Estrazione lecita per me, furto per te” non è un’eccezione cinica al sistema delle regole: è il sistema delle regole, scritto da chi è arrivato primo.

E Michel Foucault completa il quadro: in Sorvegliare e punire (1975) mostrava come ogni regime di potere produca il proprio regime di verità, perché sapere e potere si tengono in piedi a vicenda. Il regime che oggi decide che addestrare su sette milioni di libri rubati è “trasformativo” mentre interrogare un’interfaccia pubblica è un crimine non sta scoprendo una verità preesistente sul furto: la sta fabbricando, e la fabbrica chi controlla i laboratori, i brevetti e i comunicati stampa. È, alla lettera, il diritto di rubare solo a me.

Non è ipocrisia, è una recinzione

La lettura facile, quella che ha già fatto il giro della rete (Cybernews ha titolato senza giri di parole “Hypocrisy, anyone?”, Trad. “Ipocrisia, qualcuno?”), si ferma alla parola “ipocrisia”, ma è una lettura troppo comoda, e un po’ pigra. L’ipocrisia è un difetto morale individuale, e individuare un difetto morale è il modo più rapido per non capire un meccanismo strutturale. Quello che sta accadendo ha un nome più preciso e una storia più lunga, e l’ha raccontata il giurista James Boyle in un saggio del 2003, The Second Enclosure Movement and the Construction of the Public Domain (Trad. “Il secondo movimento delle recinzioni e la costruzione del pubblico dominio”). La prima recinzione, le enclosures, è quella che tra il Cinquecento e l’Ottocento in Inghilterra ha trasformato i pascoli comuni, dove chiunque poteva portare le pecore, in proprietà private chiuse da siepi e muretti. Boyle sosteneva che ne fosse in corso una seconda, stavolta sui beni immateriali: la conoscenza, le idee, la cultura, recintate dal diritto di proprietà intellettuale e sottratte a quel territorio aperto che è il pubblico dominio. È la stessa tesi che Lawrence Lessig porta avanti in Free Culture (2004): i pionieri costruiscono le loro fortune attingendo a piene mani dal patrimonio comune, e una volta arrivati in cima chiudono il cancello alle spalle, perché nessuno faccia a loro ciò che loro hanno fatto a tutti.

La vicenda della distillazione è il secondo movimento delle recinzioni applicato all’intelligenza artificiale, allo stato puro: il bene comune, qui, è lo scibile umano: i libri, gli articoli, il codice, le conversazioni, l’enorme deposito di lavoro intellettuale accumulato dalla specie. Chi arriva per primo lo recinta una volta sola, lo trasforma in un modello privato, e da quel momento difende il recinto come proprietà legittima contro chiunque provi a estrarre da lui ciò che lui ha estratto da noi. La mossa decisiva non è il prelievo iniziale, è la conversione: trasformare una appropriazione del comune in un asset proprietario, e poi spostare il discorso. Ed è qui che torna utile la seconda faccia del potere di Lukes, quella dell’agenda. La cronologia è eloquente. A gennaio 2025, nel suo saggio On DeepSeek and Export Controls, Dario Amodei, fondatore di Anthropic, scriveva nero su bianco “in questo saggio non prendo alcuna posizione sulle voci di distillazione dai modelli occidentali”: la distillazione, allora, non era il tema (comodo eh!). A settembre 2025 arriva il patteggiamento da 1,5 miliardi sui libri piratati. E come per magia, solo a febbraio 2026, quattro mesi dopo aver pagato per il proprio prelievo, Anthropic fa della distillazione altrui la sua battaglia pubblica. Acciderpolina, il caso come gioca strano, vero?

Nel frattempo lo stesso saggio aveva già spostato il tavolo: la domanda urgente diventa “come impediamo alla Cina di procurarsi i chip per addestrare i suoi modelli”, e non “con quale diritto, esattamente, abbiamo preso i libri di tutti senza chiedere permesso”. Una domanda scaccia l’altra. Il furto a valle, quello cinese, riempie le pagine; il furto a monte, quello fondativo, scivola fuori dall’agenda.

E lo fa, badate bene, con gli strumenti che Lessig aveva previsto già nel 1999 in Code and Other Laws of Cyberspace: le leggi e i tribunali, certo, ma prima ancora l’architettura. I cancelli delle interfacce, i termini di servizio, i sistemi di rilevamento degli account fraudolenti, e all’estremo i controlli sull’esportazione dei chip, sono codice e infrastruttura che fanno applicare la recinzione meglio di qualsiasi sentenza. “Un intervento minimo del governo nel cyberspazio non significherà meno regolazione”, scriveva Lessig: significa solo che a regolare, al posto di un’autorità eletta, sarà chi controlla l’architettura. E oggi l’architettura dell’intelligenza artificiale la controllano cinque o sei aziende.

Come “si sta dentro a questa storia a testa alta” (che modo di dire orribile!)

Attenzione a non cadere nella trappola opposta, che è altrettanto comoda: dire che siccome tutti rubano, allora nessuno ruba, e che DeepSeek o Alibaba sono gli onesti spogliatori dei ladri. Non è così, e non è questo il punto. Distillare un modello altrui violandone i termini di servizio è una scorrettezza vera, con vittime vere, e i laboratori cinesi non sono dei Robin Hood dell’algoritmo. Il punto non è assolvere chi imita: è pretendere che la regola sul furto valga in un verso solo finché non valga in tutti i versi.

La via per “starci dentro a testa alta”, come dicono gli americani, si chiama simmetria delle regole, e per una volta è una richiesta concreta, non un auspicio: se imparare osservando le rtisposte di un sistema è furto quando un laboratorio cinese lo fa a Claude, allora imparare dai libri dell’umanità senza consenso e senza compenso è esattamente lo stesso furto quando Anthropic lo fa a noi: o sono entrambe estrazioni che decidiamo di regolare, con licenze, compensi, meccanismi di adesione e di rifiuto, oppure non lo è nessuna delle due, e allora che si smetta di chiamare in causa la sicurezza nazionale ogni volta che lo sfidante fa al campione ciò che il campione ha fatto al mondo. Il bene comune da cui tutti hanno attinto va governato come bene comune, non recintato da chi è arrivato un’ora prima degli altri. Questo, sul piano della policy, vuol dire trattare i dati di addestramento come una risorsa con regole pubbliche e uguali per tutti, e non come un Far West in cui l’unica legge è la velocità del primo a piantare la bandiera.

C’è una frase, in fondo, che Anthropic potrebbe dire e non dirà mai, perché è insieme la più onesta e la più scomoda. Non “ci hanno rubato il modello”, ma “ci siamo arrivati prima noi”. Tutto il resto, i comunicati sul furto cinese, i memo al Congresso, i saggi sui chip, serve a coprire la distanza tra queste due frasi: e quella distanza, dal pascolo comune recintato di Proudhon fino al modello linguistico, è sempre stata l’unica cosa che separa il pioniere dal ladro.

Per Approfondire

Hinton, G., Vinyals, O. & Dean, J.: “Distilling the Knowledge in a Neural Network” (2015) | https://arxiv.org/abs/1503.02531
CNBC: “Anthropic accuses DeepSeek, Moonshot and MiniMax of distillation attacks on Claude” (24 febbraio 2026) | https://www.cnbc.com/2026/02/24/anthropic-openai-china-firms-distillation-deepseek.html
Fortune: “Anthropic claims 3 Chinese companies ripped it off” (24 febbraio 2026) | https://fortune.com/2026/02/24/anthropic-china-deepseek-theft-claude-distillation-copyright-national-security/
Inc.: “Anthropic Accused Alibaba of a Distillation Attack” (giugno 2026) | https://www.inc.com/hazel-gandhi/anthropic-accused-alibaba-of-a-distillation-attack-heres-what-that-means-and-why-its-so-dangerous/91365906
NPR: “Anthropic to pay authors $1.5 billion in settlement” (5 settembre 2025) | https://www.npr.org/2025/09/05/g-s1-87367/anthropic-authors-settlement-pirated-chatbot-training-material
PBS NewsHour: “Anthropic to pay authors $1.5B in landmark settlement over pirated chatbot training material” (5 settembre 2025) | https://www.pbs.org/newshour/nation/anthropic-to-pay-authors-1-5b-in-landmark-settlement-over-pirated-chatbot-training-material
Authors Guild: “What Authors Need to Know About the Anthropic Settlement” (2025) | https://authorsguild.org/advocacy/artificial-intelligence/what-authors-need-to-know-about-the-anthropic-settlement/
Dario Amodei: “On DeepSeek and Export Controls” (29 gennaio 2025) | https://darioamodei.com/post/on-deepseek-and-export-controls
Cybernews: “Hypocrisy, anyone? Anthropic accuses Chinese AI labs of illicit distillation” (2026) | https://cybernews.com/ai-news/anthropic-ai-china-distillation-attack/
Zuboff, S.: The Age of Surveillance Capitalism (PublicAffairs, 2019)
Lukes, S.: Power: A Radical View (Macmillan, 1974)
Gramsci, A.: Quaderni del carcere (1929-1935)
Foucault, M.: Surveiller et punir (Gallimard, 1975)
Proudhon, P.-J.: Qu’est-ce que la propriété? (1840)
Boyle, J.: “The Second Enclosure Movement and the Construction of the Public Domain” (Law and Contemporary Problems, 2003)
Lessig, L.: Free Culture (Penguin, 2004) e Code and Other Laws of Cyberspace (Basic Books, 1999)