FISICA E BIG DATA

L’aumento della sensibilità e dell’efficienza degli esperimenti di fisica, unita all’utilizzo di un’elettronica sempre più tecnologicamente avanzata, ha portato negli ultimi decenni a un’esplosione della quantità di dati raccolti durante gli esperimenti. Se da un lato questo aspetto gioca naturalmente a favore della precisione delle misure, dall’altro richiede di adottare soluzioni avanzate per la gestione e l’analisi di enormi dataset. Al tempo stesso, il paradigma dei “big data” influisce anche sulla progettazione degli stessi esperimenti e sugli strumenti computazionali necessari: in particolare, la simulazione di fenomeni complessi richiede la generazione di grandi quantità di dati virtuali, così da poter confrontare i risultati sperimentali con simulazioni dettagliate.

Un esempio significativo dell’impatto dei big data nella fisica contemporanea è rappresentato dall’acceleratore di particelle LHC, al CERN di Ginevra, che può essere considerata senza esagerazioni la più grande fabbrica di informazione del mondo. In piena operatività, la macchina realizza circa 25 collisioni tra protoni ogni 27 miliardesimi di secondo, pari a 600 milioni di collisioni al secondo. Attraverso opportuni software di controllo, oltre il 90% dei dati prodotti da queste collisioni viene eliminato perché non di interesse, mentre solo una piccola parte (scientificamente rilevante) viene salvata e poi studiata. Tuttavia, anche solo questa porzione di dati conservati corrisponde a una quantità di informazione pari all’intero traffico telefonico dell’Europa. Per studiare una tale quantità di dati non sono sufficienti i supercomputer presenti al CERN, né i centri di supercalcolo europei, ma è stato necessario strutturare una rete globale (worldwide LHC computing grid) composta da 1,4 milioni di computer e 1,5 exabytes di capacità di stoccaggio di dati, distribuiti in 42 paesi. L’INFN è uno dei promotori principali del progetto Grid e ospita al CNAF di Bologna uno degli 11 nodi di primo livello della rete globale.

CERN Data Center (© Bennett, Sophia Elizabeth)