
L’infrastruttura ENEA per il supercalcolo HPC e l’IA
DOI 10.12910/EAI2025-021
di Giovanni Ponti, Angelo Mariano, Massimo Celino, Dipartimento Tecnologie energetiche e fonti rinnovabili, Divisione per lo Sviluppo di Sistemi per l’Informatica e l’ICT – ENEA; Francesco Iannone, Dipartimento Tecnologie energetiche e fonti rinnovabili, Divisione per lo Sviluppo di Sistemi per l’Informatica e l’ICT, Laboratorio Infrastrutture per il Calcolo Scientifico e ad Alte PrestazionI- ENEA
ENEA ha sviluppato un'infrastruttura avanzata di supercalcolo HPC e Big Data, aperta e flessibile, che consente la realizzazione di progetti all'avanguardia in diversi settori della ricerca, inclusa quella industriale. Sono in corso di sviluppo nuove tecnologie cloud-edge continuum per rispondere alla crescente domanda di calcolo, gestione dati e servizi IA.
L’ENEA ha una lunga storia e competenze nella gestione di infrastrutture di calcolo scientifico a supporto delle attività di ricerca. I datacenter ENEA ospitano i sistemi di calcolo CRESCO [1], che dal 2008 offrono infrastrutture di calcolo all’avanguardia in campo calcolo parallelo ad alte prestazioni (HPC). Questi sistemi trovano applicazione in numerose attività svolte in ambito di progettualità nazionali ed internazionali, nel corso delle quali sono stati sviluppati modelli nel campo dell’ HPC, gestione dei dati su infrastrutture di calcolo parallelo e sistemi storage avanzati, e tecnologie di interconnessione di rete a bassa latenza per garantire il rapido accesso ai dati da elaborare e il collegamento tra datacenter ENEA distribuiti sul territorio.
Progettualità e sfide di ricerca
Le competenze sviluppate nel corso degli anni si sono consolidate in importanti partecipazioni progettuali negli ultimi venti anni. Solo per citarne alcuni tra gli ultimi in corso, si può far riferimento al progetto TEXTAROSSA [2] per quanto riguarda il calcolo parallelo avanzato e l’uso di acceleratori per EuroHPC, e la serie di progetti EoCoE per l’energia e la scienza dei materiali [3], fino ad arrivare ai recenti PNRR Centro Nazionale di Ricerca in High Performance Computing, Big Data e Quantum Computing (ICSC [4]), Rome Technopole per il rilancio dei processi di innovazione del Lazio in ambito digitale ed energetico [5], e il progetto DTT-U [6] in ambito della fusione nucleare dove le infrastrutture di calcolo supportano lo studio della geometria e la modellazione del divertore.
Recentemente, si stanno affrontando anche le tematiche legate all’Intelligenza Artificiale (IA), supportando anche in questo caso diverse progettualità e sfide di ricerca. L’aspetto più importante è che la rivoluzione disruptive introdotta dall’IA, unita al consolidamento del paradigma dei servizi in Cloud, sta stravolgendo il modo in cui i servizi HPC vengono erogati, spingendo verso infrastrutture sempre più innovative con acceleratori grafici (GPU) e modelli di servizi più flessibili.
Anche l’ENEA sta rispondendo alle nuove esigenze del settore ICT. La divisione ICT del dipartimento Tecnologie energetiche e fonti rinnovabili (TERIN) sta avviando un processo di transizione dei paradigmi di calcolo scientifico per adeguare l’offerta delle risorse di calcolo e delle facility computazionali a supporto delle nuove frontiere tecnologiche e applicative, andando sempre più nella direzione di offrire servizi HPC flessibili in Cloud.
Nel seguito, saranno descritte le risorse di calcolo HPC presenti in ENEA e come si sta declinando la proposta servizi in Cloud e le nuove frontiere in termini di applicazioni che fanno uso dell’IA, con riferimento ai progetti in corso e di prossimo inizio.
L’High Performance Computing
ENEA è parte attiva nell'ecosistema europeo dell'HPC (High Performance Computing), grazie alla sua partecipazione alle iniziative internazionali di grande rilievo come Eurofusion ed EuroHPC Joint Undertaking [7,8]. ENEA gestisce una rilevante piattaforma di supercalcolo HPC denominata CRESCO [1] e contribuisce alla ricerca e sviluppo di nuove architetture eterogenee di supercalcolo che hanno l'obiettivo erogare prestazioni che oramai possono raggiungere l'incredibile velocità computazionale dell'ordine dell'exascale (pari a 10^18 operazioni al secondo), mantenendo un consumo energetico sostenibile. Accanto allo sviluppo hardware, ENEA si occupa anche di creare nuovi modelli di programmazione e ambienti di sviluppo, ottimizzati per sfruttare al meglio queste architetture avanzate.
Negli anni, i sistemi HPC di ENEA sono cresciuti in risposta all’aumento delle richieste dei ricercatori, dimostrando che la piattaforma CRESCO è un elemento cruciale per l'acquisizione di nuovi finanziamenti e per il successo di progetti in settori strategici come l'energia e l'ambiente. Questi progetti spaziano dalla fusione nucleare alla meteorologia, dalla combustione alla progettazione di materiali innovativi e sistemi molecolari di interesse biologico. La disponibilità di infrastrutture di supercalcolo HPC è un elemento assolutamente necessario per ogni attività che implica l’utilizzo di strumenti basati su tecnologie di intelligenza artificiale.
Dal 2007, ENEA ha consolidato la sua esperienza nel supercalcolo attraverso la partecipazione a numerosi progetti nazionali ed europei. Questo percorso ha permesso la costante evoluzione dei sistemi CRESCO, principalmente presso la sede di Portici, che hanno visto un aumento significativo delle capacità di calcolo in termini di TFlops (teraflops). I primi sistemi, come CRESCO1, CRESCO2 e CRESCO4, sono stati realizzati nell'ambito di progetti PON, mentre CRESCO6 e CRESCO7, con potenze di picco rispettivamente di 1,4 e 0,5 PFlops, sono stati sviluppati nell’ambito dei servizi HPC che ENEA, in collaborazione con CINECA, mette a disposizione della comunità scientifica e della fusione nucleare europea attraverso il consorzio Eurofusion. L’infrastruttura CRESCO è oggi considerata come prioritaria a livello nazionale dal PNIR 2021-2027.
Entro la fine del 2024 sarà disponibile CRESCO8 presso il centro ricerche di Portici, che con i suoi 9 PFlops di picco, costituirà la risorsa di calcolo HPC di riferimento per le attività di ricerca ENEA. Il calcolatore è finanziato dai fondi del progetto PNRR DTT-U [6].
Analisi di grandi quantità di dati
L’espansione delle capacità computazionali di ENEA non solo risponde alla crescente domanda interna di risorse, ma si è rivelato spesso un fattore cruciale per l’acquisizione e il successo di progetti di ricerca e innovazione strategici. L’obiettivo di ENEA è fornire risorse computazionali attraverso la piattaforma ENEAGrid, integrando tali risorse nelle attività di ricerca e sviluppo dell’ente. Nel 2023, l’utilizzo dei sistemi CRESCO ha superato i 122 milioni di core-hour, un valore equivalente a circa 1,5 milioni di euro, se paragonato ai costi di risorse cloud commerciali come Amazon Web Services (AWS).
Recentemente ENEA ha coordinato il progetto EuroHPC TEXTAROSSA [2], che ha sviluppato prototipi di nodi di calcolo hardware e software a basso consumo, specificamente progettati per l'analisi di grandi quantità di dati, una risorsa sempre più preziosa nelle applicazioni moderne.
ENEA è inoltre membro fondatore del Centro Nazionale HPC Big Data and Quantum Computing (ICSC) [4], dove collabora negli Spoke dedicati a "Future HPC", "Materials & Molecular Science", "Environment & Natural Disasters" ed "Earth & Climate". In questi ambiti, ENEA lavora allo sviluppo di simulazioni complesse e "grandi sfide", in collaborazione con partner industriali e accademici italiani, per la realizzazione di piattaforme per la simulazione di problemi strategici attraverso il supercalcolo. Parallelamente, ENEA è coinvolta nel Centro Europeo di Eccellenza per il supercalcolo nel settore delle energie rinnovabili (EoCoE-III) [3]. Qui, l'ente è impegnato nella progettazione e sviluppo di codici di calcolo in grado di sfruttare i supercomputer exascale europei per supportare la transizione energetica verso fonti rinnovabili, con applicazioni che includono simulazioni su larga scala di impianti eolici, gestione delle risorse idriche e la progettazione di nuovi materiali. In quest'ultimo ambito, CRESCO è il motore computazionale della piattaforma Mission Innovation IEMAP (Italian Energy Materials Acceleration Platform), volta a velocizzare la progettazione di nuovi materiali per l’energia tramite Big Data e intelligenza artificiale [9].
L’intelligenza artificiale
La disponibilità di supercomputer in grado di elaborare enormi quantità di dati ha rivoluzionato, negli ultimi anni, lo sviluppo e l’ottimizzazione degli algoritmi di machine learning, permettendo di processare volumi di informazioni impensabili fino a poco tempo fa. La capacità di questi algoritmi di analizzare e interpretare i dati è cresciuta a tal punto da sembrare quasi una nuova forma di intelligenza, capace di generare nuovi contenuti a una velocità sorprendente. L’HPC ha reso possibile questo enorme progresso, tanto che l'Intelligenza Artificiale (IA) è ormai diventata una realtà pervasiva, trasformando radicalmente il nostro modo di lavorare e vivere. Esistono molteplici tipi di AI, da quella analitica a quella predittiva, passando per l’intelligenza supervisionata e non supervisionata, fino ad arrivare all'IA generativa, che crea nuovi contenuti, e alla robotica.
Un esempio attuale di applicazione avanzata dell'IA è la guida autonoma, recentemente tornata al centro dell'attenzione con i Robotaxi di Tesla. Giova ricordare che i vantaggi dell'IA sono innumerevoli: automatizzazione di processi ripetitivi, analisi dati più accurate, sviluppo di nuovi prodotti e servizi. Tuttavia, esistono anche delle sfide, come la necessità di garantire l'eticità dell'AI e di mitigare i rischi legati alla riduzione di lavoro non specializzato. Per quanto riguarda l'ENEA, l’ente usa ampiamente soluzioni di IA per ottimizzare la ricerca in ambito energetico, analizzare grandi quantità di dati provenienti dai sensori, sviluppare modelli predittivi per il monitoraggio ambientale e migliorare la sicurezza cibernetica.
L'impatto dell'IA sulla competitività delle imprese è innegabile. Le aziende che adottano soluzioni basate sull'IA possono acquisire un vantaggio competitivo significativo, ottimizzando i processi, personalizzando i prodotti e servizi, e prendendo decisioni più informate. Tuttavia, per sfruttare appieno il potenziale dell'IA è necessario disporre di risorse di calcolo adeguate, come infrastrutture cloud potenti e chip specializzati. L'ENEA, con le sue competenze in ambito di supercalcolo e AI, può svolgere un ruolo chiave nello sviluppo di soluzioni IA accessibili e sostenibili per le imprese italiane, anche attraverso il coinvolgimento negli European Digital Innovation Hubs.
Le tendenze future dell'IA sono molto promettenti. Si prevede un'ulteriore diffusione dell'IA in tutti i settori, con lo sviluppo di applicazioni sempre più sofisticate e personalizzate. L'integrazione tra IA e altre tecnologie emergenti, come l'Internet delle Cose (IoT) e il cloud-edge continuum, aprirà nuove frontiere. L'ENEA sta investendo ampiamente in queste soluzioni favorendo la costruzione di una piattaforma con tutti gli strumenti necessari per ogni fase del processo: dalla preparazione dei dati alla creazione e all'addestramento dei modelli, fino alla loro distribuzione in un ambiente produttivo. Il tutto è gestito in modo automatizzato e scalabile, permettendo ai data scientist di concentrarsi sull'innovazione piuttosto che sulla gestione dell'infrastruttura sottostante. Questa piattaforma sarà il core del contributo di ENEA a IPCEI-CIS, meglio descritto nel paragrafo successivo.
L'IA, dunque, può essere un potente acceleratore dell'innovazione e della crescita economica, ma è fondamentale affrontare le sfide legate alla sua implementazione, come la necessità di garantire la sicurezza dei dati e l'eticità delle applicazioni, tutti ambiti in cui l’ENEA con le sue competenze e le sue infrastrutture si sta impegnando in prima persona.
Il Cloud-edge computing
L'aumento esponenziale dei dati generati da dispositivi come sensori, telefoni cellulari e laboratori automatizzati, insieme alla crescente importanza strategica dei dati stessi, ha portato a un forte interesse per le tecnologie cloud-edge. Tuttavia, il mercato del cloud è dominato da poche grandi aziende internazionali (Google, Microsoft, Amazon, Alibaba, etc), mentre i fornitori europei sono frammentati e rappresentano meno del 13% del mercato globale. Questa frammentazione limita la scalabilità, l'interoperabilità e la trasparenza delle offerte, ostacolando la piena espressione del potenziale innovativo dell'Europa.
Per rispondere a queste sfide, l'Europa ha lanciato l'IPCEI-CIS (IPCEI Next Generation Cloud Infrastructure and Services), un'iniziativa strategica per creare un cloud federato europeo per le industrie, riducendo la dipendenza dalle grandi aziende extraeuropee [10]. Secondo sondaggi recenti, molte aziende vogliono collaborare con fornitori europei, e il 95% di esse ritiene problematica la sicurezza dei dati e la conformità con il GDPR. L'IPCEI-CIS mira a creare un "Cloud-Edge Continuum" multi-fornitore, il primo nel suo genere, che consenta di sviluppare modelli di business basati su intelligenza artificiale (IA) e Internet delle Cose (IoT) in settori come la manifattura, la mobilità, l'energia e il turismo, promuovendo al contempo la sostenibilità energetica.
In questo contesto, ENEA gioca un ruolo chiave con il progetto DataCLEEN (Data CLoud for Energy and ENvironment). L'obiettivo di DataCLEEN è creare un'infrastruttura cloud che farà parte del cloud industriale europeo, utilizzando il calcolo ad alte prestazioni (CRESCO7, CRESCO8) in un continuum cloud-edge federato, scalabile e affidabile. Questo sistema offrirà servizi di IA componibili e strumenti per la gestione dei Big Data, con l'obiettivo di accelerare la transizione energetica e favorire lo sviluppo di nuovi prodotti e servizi, coinvolgendo imprese e istituzioni pubbliche in Italia e in Europa. ENEA si propone di creare un ambiente pilota che aiuti le aziende nella migrazione verso il cloud e nella loro prima implementazione industriale, favorendo il trasferimento tecnologico e la validazione delle tecnologie su larga scala.
DataCLEEN partecipa a quattro filoni di lavoro dell'IPCEI-CIS, contribuendo alla catena del valore dalle infrastrutture alle applicazioni. Il progetto prevede la costruzione di quattro nuovi data center federati, energeticamente efficienti e con elevate capacità di calcolo, lo sviluppo di un layer software per l'orchestrazione dell'infrastruttura, e la creazione di servizi IA e di scambio dati per l'infrastruttura cloud-edge. Il progetto implementerà applicazioni in settori strategici come infrastrutture critiche, smart cities, patrimonio culturale e materiali per l'energia.
DataCLEEN rappresenta un'innovazione importante poiché non esistono altre infrastrutture simili dedicate alla gestione ed elaborazioni di grandi moli di dati per applicazioni energetiche e ambientali, che riesca a mettere nella stessa filiera in maniera trasparente chi genera i dati e chi li deve utilizzare senza che la complessità dell’infrastruttura distribuita e dei suoi servizi sia un ostacolo al progresso della conoscenza e all’innovazione.
Bibliografia
[2] TEXTAROSSA
[3] EoCoE-III
[4] ICSC
[5] Rome Technopole
[6] DTT-U
[7] Eurofusion
[8] EuroHPC
[9] IEMAP
[10] IPCEI-CIS