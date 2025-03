(Il Sole 24 Ore Radiocor) - Milano, 01 mar - Dalla Cina con rimorso. Quello di Sam Altman, capo di OpenAi (creatore di ChatGpt), che a valle del successo del modello cinese open Deepseek ha ammesso di sentirsi 'dalla parte sbagliata della storia'. Il rimorso e' sulla tendenza, abbracciata da quasi tutte le big tech negli ultimi anni, di diventare sempre piu' chiuse riguardo ai propri prodotti di intelligenza artificiale (Ia). Tengono segrete le ricerche, le tecniche alla base dei propri modelli e il loro codice informatico. Sono, per loro, segreti industriali, necessari a proteggere i miliardi di investimento fatti in passato e in corso. Sono 320 i miliardi previsti dalle big tech Usa nel 2025 per l'Ia.

L'arrivo di Deepseek e' stato un terremoto per questa tendenza. La sua ricetta e' pubblica, dettagliata in un paper scientifico. E' aperto il suo codice informatico (open source), che puo' essere quindi analizzato, modificato ed esportato in varie applicazioni, come gia' avviene (e' usabile nell'Ia dell'americana Perplexity, tra l'altro; quindi gli utenti possono usare la tecnologia Deepseek tramite Perplexity senza passare dall'azienda cinese ne' darle i propri dati).

Il punto e' che il suo modello open - il codice e la collaborazione aperta tra ingegneri, ricercatori - e' forse il motivo principale dell'innovazione alla base di Deepseek, secondo vari esperti. Ne e' convinto Yann LeCun, responsabile dell'Ia per Meta, la sola big tech americana a puntare su un modello open, Llama. La sua tesi e' che ogni innovazione dirompente ha bisogno di modelli aperti di ricerca e codice informatico, che tutti possano vedere e parteciparvi. Il fenomeno internet e' nato e si fonda tuttora su protocolli open - il web, la mail, la trasmissione dati e connessioni tra computer. La maggior parte dei server che ci danno tutti i servizi internet viaggia su Linux.

Beninteso, non si sa come andra' a finire nella lotta tra open e closed sull'Ia. Lo stesso Altman mette le mani avanti, aggiungendo che (solo) in futuro potrebbe cambiare il loro approccio all'open source. In effetti ci sono dubbi anche sullo stesso Deepseek. La sua Ia e' apparsa come una rivoluzione, in un paper scientifico pubblicato dai ricercatori, perche' realizzata con 5-6 milioni di dollari contro i miliardi delle big tech Usa. Ricerche indipendenti hanno poi pero' stimato che a costare cosi' poco e' forse stato solo l'ultimo passaggio, prima del lancio del prodotto, che pero' poggia su un'attivita' di ricerca e sviluppo durata mesi e costata oltre un miliardo di dollari.

Ma e' vero che, secondo le analisi dell'azienda specializzata Artificial Analysis, usare Deepseek e' dieci volte piu' economico, per le aziende, rispetto a Gpt-4 di OpenAi, per risultati comparabili. Le sue tecniche, anche poi integrate in prodotti di concorrenti, puo' quindi contribuire a diffondere l'Ia in aziende piu' piccole. Come le nostre Pmi, che ora - dati degli osservatori del Politecnico di Milano - stentano a adottare la tecnologia (a differenza delle grandi aziende italiane). In piu', quest'efficienza rende Deepseek anche piu' sostenibile a livello energetico.

Insomma: la produttivita' e il Pianeta potrebbero ringraziare la mossa dell'azienda cinese, che puo' spingere altre aziende a essere piu' efficienti.

La differenza e' appunto nelle tecniche adoperate dai ricercatori, sia per addestrare (quindi produrre) il modello sia per farlo funzionare.

Si consideri il modello di 'ragionamento', Deepseek R1, specializzato in risposte complesse (tecniche, scientifiche), e considerato (da test indipendenti) competitivo con i piu' costosi modelli americani. La novita' citata come piu' importante: a differenza dei modelli AI tradizionali, solo una frazione delle impostazioni regolabili di R1 e' attiva durante ogni singola operazione. La riduzione dei parametri attivi riduce di molto la potenza e i calcoli necessari per l'elaborazione e consente al modello di funzionare su chip piu' economici e meno sofisticati. R1 funziona quindi dividendosi in piu' reti di calcolo, con diverse specializzazioni. Alcune richieste richiedono diverse specializzazioni e per rispondere alle richieste il modello elabora solo le reti che ha imparato essere le piu' rilevanti caso per caso. Il metodo, chiamato 'mix di esperti', era noto gia' prima di Deepseek. La abilita' pero' e' stata di riuscire a farlo funzionare bene.

Le efficienze poggiano poi su una grande quantita' di trucchetti. Ad esempio, Deepseek ha escogitato ottimizzazioni a basso livello dell'hardware; ha creato algoritmi per massimizzare le prestazioni di chip Nvidia meno potenti di quelli top, che in Cina sono vietati dai dazi americani. Ha anche trovato un modo piu' efficiente per gestire la memoria del sistema durante l'inferenza, ossia la risposta all'utente, riducendone i costi del 93 per cento.

Un altro punto: e' vero che le innovazioni di Deepseek sono collegate a un modello aperto di collaborazione tra ricercatori; ma sono state possibili perche' l'azienda cinese ha funzionato come un laboratorio di ricerca senza fini di lucro: si e' potuta permettere di rischiare soldi in tecniche che avrebbero potuto rivelarsi un flop. E l'ha potuto fare perche', con la sua capogruppo High-Flyer, e' parte dell'iniziativa Hangzhou Chengxi Science and Technology Innovation Corridor', fortemente sovvenzionata dallo Stato cinese, che vuole creare un'alternativa alla Silicon Valley.

Insomma: Deepseek, con le sue tecniche e il suo approccio open, e' si' un terremoto che puo' avere anche influssi positivi sull'innovazione, la diffusione e la sostenibilita' dell'Ia; ma e' bene sempre tenere a mente la sua genesi, che affonda nella geopolitica della Cina, e i lati oscuri ancora non risolti.

Alessandro Longo

