Per un paio d’anni abbiamo pensato che il prodotto dell’intelligenza artificiale cominciasse da una casella di testo. Scrivi una domanda, arriva una risposta, il resto è magia computazionale nascosta dietro un’interfaccia pulita. Era una rappresentazione comoda, e in parte vera. Ma nell’aprile del 2026 quella immagine comincia a non bastare più. Quando Anthropic ha iniziato a chiedere ad alcuni utenti di Claude un documento di identità e un controllo con selfie dal vivo per accedere a determinate capacità, la reazione più immediata è stata leggere la misura come un inciampo reputazionale, un eccesso di prudenza o un errore di prodotto. Tutto comprensibile. Ma la frizione compare in un punto molto preciso: all’ingresso.

Per anni la frizione dell’AI è stata soprattutto nel mezzo del percorso. La si incontrava nella qualità delle risposte, nelle allucinazioni, nella lentezza, nei limiti di contesto, nei costi dell’API. Adesso una parte crescente della frizione si sposta prima ancora che il lavoro cominci. Chi sei, dove ti trovi, che tipo di attività vuoi svolgere, quali strumenti vuoi attivare, con quale profilo di rischio stai entrando, quanta capacità computazionale sei autorizzato a consumare: sono tutte domande che stanno scendendo dal livello della governance interna a quello del prodotto visibile.

La trasformazione è più ampia del fastidio per una verifica d’identità. L’intelligenza artificiale di frontiera sta smettendo di assomigliare al software di consumo che cresce semplicemente aggiungendo utenti. Sta diventando, sempre di più, una infrastruttura ad accesso gestito. Non vuol dire che stia diventando meno utile. Vuol dire che la sua forma economica e politica si sta chiarendo. Dietro la conversazione naturale non c’è una risorsa virtualmente infinita, ma un insieme molto fisico di data center, chip, energia, rete, policy di sicurezza, sistemi di monitoraggio e decisioni commerciali su chi servire prima e a quali condizioni.

Questa realtà era già scritta nell’infrastruttura. Ora comincia a vedersi anche nella facciata.

La prudenza sui data center aveva un prezzo

A febbraio, Dario Amodei aveva descritto con grande chiarezza il dilemma del settore. Il problema, spiegava, non è solo capire quanto potente diventerà l’AI, ma quando quella potenza si trasformerà in ricavi sufficienti a sostenere gli investimenti necessari per costruirla. Se compri capacità troppo presto, rischi di distruggerti. Se la compri troppo tardi, rischi di non riuscire a servire la domanda quando arriva. Da qui la sua osservazione più memorabile: sbagliare di un paio d’anni, nella tempistica con cui si comprano i data center, può essere rovinoso.

Era un ragionamento serio, non una posa comunicativa. E restava coerente con il profilo di Anthropic: più attenta ai margini, più vicina all’impresa che al consumo di massa, meno incline a trasformare ogni promessa infrastrutturale in un esercizio di gigantismo performativo. Ma ogni prudenza, nel momento in cui la domanda accelera davvero, presenta il conto. E il conto non si presenta solo in bilancio. Si presenta nel prodotto.

Il contrasto con OpenAI è istruttivo. Stargate, il progetto con SoftBank e Oracle, punta fino a 500 miliardi di dollari in quattro anni e a una traiettoria da 10 gigawatt di infrastruttura AI negli Stati Uniti. I siti annunciati nel 2025 portano già la capacità pianificata vicino ai 7 gigawatt e ad Abilene sono partiti i primi carichi di training e inferenza. OpenAI ha scelto di materializzare molto presto il proprio appetito per il calcolo, accettando il rischio finanziario e politico che comporta.

Anthropic non è affatto rimasta immobile. Ha Project Rainier con AWS già operativo, quasi mezzo milione di chip Trainium2 e la prospettiva di superare il milione di chip entro la fine dell’anno per training e inferenza di Claude. Ha anche ampliato l’uso dei TPU Google con una capacità attesa oltre il gigawatt nel 2026. E pochi giorni fa ha firmato un nuovo accordo con Google e Broadcom per più gigawatt aggiuntivi di capacità TPU di nuova generazione, destinati però a entrare in funzione a partire dal 2027.

Questa sequenza impedisce una lettura infantile del problema. Anthropic non è una società senza calcolo. È una società che sta crescendo rapidamente e che, al tempo stesso, continua a gestire con attenzione la tempistica delle sue scommesse infrastrutturali. Proprio questa attenzione rende più visibile un fatto: tra la capacità disponibile oggi, quella che entrerà davvero in produzione nel 2026 e quella più pesante che arriverà dal 2027 in avanti, c’è una zona di pressione. Se nel frattempo la domanda si sposta verso prodotti più costosi da servire, la porta d’ingresso diventa un luogo di selezione.

L’agente consuma un’altra economia

Il punto decisivo è che non stiamo più parlando soltanto di chatbot. Il settore si è spostato sugli agenti: sistemi che leggono repository, navigano il web, usano terminali, chiamano strumenti, lavorano su più passaggi, mantengono stato, ritornano sul compito, chiedono supervisione, eseguono flussi lunghi. Sulla carta sembra un’estensione naturale della conversazione. In realtà cambia completamente l’economia dell’uso.

Una chat ordinaria è intermittente. Un agente è persistente. Una chat consuma pochi turni e poi si spegne. Un agente rimane dentro il compito, apre contesti lunghi, legge file, orchestra strumenti, produce artefatti, lancia verifiche, talvolta gira in parallelo. Non serve avere un foglio Excel interno del settore per capire che il secondo mondo è molto più costoso del primo. Basta guardare a come le aziende stesse descrivono i loro prodotti.

Anthropic, quando presenta Sonnet 4.6, insiste sulle “agentic workloads”, sui compiti di lunga durata, sull’orchestrazione e sul lavoro dentro codebase estese. Nei documenti tecnici dedicati a Claude Code e allo sviluppo di applicazioni di lunga durata, la società parla apertamente di lavoro autonomo prolungato, di strutture multi-agente, di revisione iterativa, di gestione del contesto nel tempo. OpenAI, dal canto suo, descrive ChatGPT agent come un sistema che naviga siti, usa browser visuali e testuali, lavora con terminali, connettori, fogli di calcolo e slide, e lo distribuisce con quote mensili precise: 400 messaggi per Pro, 40 per gli altri piani paganti, oltre a opzioni flessibili a credito.

Questa non è una differenza cosmetica. È la nascita di una nuova unità economica del prodotto. L’utente non compra più soltanto risposte. Compra attenzione computazionale prolungata. Compra sessioni. Compra supervisione. Compra, in una certa misura, il diritto di occupare per più tempo una parte della macchina.

Per questo l’industria intera sta cambiando lessico. Non parla più solo di modelli migliori. Parla di capacità, orchestrazione, efficienza, tool use, contesto, latenza, quota, priorità, classi di accesso. Il passaggio è sottile ma enorme. Finché il prodotto sembrava una chat illimitata, l’esperienza utente poteva fingere di essere universale. Quando il prodotto diventa un agente che lavora davvero, qualcuno deve decidere chi entra, quanto può restare, quali strumenti può usare e sotto quale vigilanza.

Sicurezza e scarsità si sono incontrate nello stesso punto

Sarebbe però un errore leggere la verifica dell’identità introdotta da Anthropic come una pura misura di razionamento del calcolo. L’azienda dice apertamente che il sistema serve a prevenire abusi, far rispettare le policy e adempiere a obblighi legali. E questa spiegazione non è un paravento vuoto. A febbraio Anthropic ha pubblicato un documento molto duro sulle campagne di distillazione condotte, secondo la società, da laboratori cinesi attraverso circa 24.000 account fraudolenti e oltre 16 milioni di scambi con Claude. In quel contesto spiegava di avere già rafforzato i controlli di verifica negli account educativi, nei programmi di ricerca sulla sicurezza e nelle organizzazioni startup, cioè nei canali più sfruttati per costruire accessi fittizi su larga scala.

Qui la storia smette di essere una semplice polemica tra fanbase di prodotti rivali e diventa una questione strutturale. Se i modelli migliori sono abbastanza preziosi da essere bersaglio di campagne industriali di estrazione, e se al tempo stesso sono abbastanza potenti da richiedere cautele maggiori per alcuni usi, allora l’accesso anonimo, uniforme e poco qualificato smette di essere la configurazione naturale del mercato. La sicurezza non resta sopra il prodotto come un tetto normativo. Scende dentro il flusso di accesso.

OpenAI sta mostrando qualcosa di molto simile, anche se con un disegno diverso. Con ChatGPT agent la società ha reso esplicito che le capacità più forti implicano un profilo di rischio più elevato, un maggior livello di supervisione per azioni sensibili, un monitoraggio più stretto contro prompt injection e un insieme più duro di salvaguardie per i rischi biologici. Non chiede un documento per l’uso normale del prodotto, ma inserisce comunque il controllo nel cuore dell’esperienza: conferme esplicite, watch mode, quote, limitazioni geografiche, capacità non ancora abilitate in certi mercati.

La differenza non è tra un attore aperto e uno chiuso. È tra due modi diversi di tradurre la stessa realtà. Più un sistema diventa capace, agentico e costoso da servire, meno il suo accesso può restare indistinto. In alcuni casi la selezione passa da quote e sorveglianza comportamentale. In altri passa da verifica dell’identità e integrità della piattaforma. In quasi tutti i casi passa da una combinazione delle due cose.

Il vero prodotto sta diventando il regime di accesso

Questa è la parte che il mercato tende ancora a sottovalutare. Nella prossima fase dell’intelligenza artificiale, il vero prodotto non sarà soltanto il modello. Sarà il regime di accesso costruito intorno al modello. Chi può usarlo, con quale latenza, con quale contesto, da quale giurisdizione, con quale livello di autonomia, con quali strumenti esterni, con quali possibilità di esportarne il valore in altri sistemi, con quali controlli in tempo reale. Tutto questo, che fino a ieri sembrava amministrazione, sta diventando concorrenza.

È anche il motivo per cui la guerra tra laboratori non si giocherà soltanto sulle classifiche di benchmark. Si giocherà sulla capacità di tenere aperta la porta più a lungo, per più persone, su più casi d’uso, senza far esplodere i costi e senza perdere il controllo del rischio. In una fase come questa, l’infrastruttura e il prodotto smettono di essere separabili. Se OpenAI costruisce prima capacità fisica sufficiente, può distribuire più agenti con meno frizione visibile e assorbire meglio l’espansione della domanda. Se Anthropic mantiene una traiettoria più disciplinata, dovrà essere più chirurgica nel decidere dove applicare filtri, controlli e verifiche, almeno finché la nuova ondata di capacità non sarà pienamente online.

La lezione vale per tutto il settore. L’AI di frontiera non è una commodity digitale che si replica all’infinito a costo marginale quasi nullo. È una macchina industriale energivora, sorvegliata, attaccata, regolata, continuamente esposta ad abusi e, sempre più spesso, incaricata di agire nel mondo reale. A queste condizioni, il sogno dell’accesso perfettamente fluido si scontra con una verità molto più dura: ogni utente in più non è solo un’opportunità commerciale, ma anche una domanda di capacità, una superficie di rischio, un problema di policy.

Claude che chiede un documento conta molto più del fastidio che provoca. È il momento in cui l’industria smette di fingere che il prodotto sia solo conversazione. Il prodotto è ormai anche identificazione, priorità, permesso, geografia, prevenzione dell’abuso, allocazione del calcolo.

Il passaggio concreto è già visibile: l’accesso all’AI non sarà più semplice come all’inizio. Più i modelli diventano agenti, più il lavoro delegato alle macchine diventa lungo e prezioso, più i fornitori dovranno decidere chi può usare cosa, per quanto tempo e con quali controlli. La prossima grande differenza tra i laboratori non sarà solo il modello migliore. Sarà la capacità di renderne l’uso sostenibile, sicuro e abbastanza aperto senza trasformare ogni porta d’ingresso in un nuovo collo di bottiglia.