Il laboratorio di fisica più grande del mondo deve tener traccia delle centinaia di terabyte di dati generati ogni secondo dagli esperimenti con il LHC

Il Large Hadron Collider (LHC) del CERN è all’avanguardia della ricerca fisica. I dati generati dalle sue fasi “Run 1” e “Run 2” sono già stati utilizzati per dimostrare l’esistenza di particelle atomiche finora mai identificate, e dunque ampliare la nostra conoscenza dell’universo e come questo si è formato. In particolare, nel 2012 i dati hanno permesso di confermare l’esistenza del bosone di Higgs.

I numeri del CERN sono sbalorditivi. A partire dalla dimensione del large hadron collider, un acceleratore di particelle circolare con un raggio di 4,3 km, alla velocità di collisione delle particelle: all’interno dei rilevatori dell’esperimento con il LHC si possono verificare fino a 1 miliardo di collisioni di particelle ogni secondo.

Ma è la quantità di dati che desta maggiore impressione, infatti le collisioni generano 1 petabyte (PB) di dati al secondo. Anche dopo aver filtrato i soli eventi interessanti, il CERN ha la necessità di immagazzinare ogni mese circa 10 PB di nuovi dati da analizzare.

Questi dati vengono immagazzinati nel centro elaborazione dati del CERN e sono condivisi con una rete di circa 170 centri elaborazione dati per la loro analisi, grazie alla Worldwide LHC Computing Grid (WLCG), la rete mondiale di calcolo per LHC.

L’attuale centro archiviazione dati del CERN comprende buffer hard disk con 3200 JBOD che contengono 100.000 hard disk drive (HDD), per un totale di 350 PB.

Le fasi Run con il LHC sono destinate e continuare e ad ogni nuovo “Run” l’archivio dati cresce in modo significativo. Dopo i necessari upgrade, la fase Run 3 del CERN è prevista per il 2021.

Gli hard disk di Toshiba Electronics Europe GmbH vengono utilizzati dal CERN dal 2014 per gestire gli enormi volumi di dati, e tre generazioni di tecnologia hard drive Toshiba hanno finora soddisfatto le crescenti esigenze di capacità di storage del centro.

Ma ciò può continuare se, come dichiara Eric Bonfillou, responsabile della divisione Facility Planning and Procurement presso il dipartimento IT del CERN: «Gli interventi di upgrade programmati per le macchine del LHC richiederanno un dimensionamento delle risorse di calcolo e archiviazione che va oltre quanto oggi la tecnologia è in grado di offrire».

Come il CERN ha incrementato la propria capacità di archiviazione dati con Toshiba

2014 – Il CERN acquista gli hard drive Toshiba

Dal 2014, il CERN utilizza gli hard drive di Toshiba. Al centro delle esigenze del CERN vi sono gli hard disk server con elevate prestazioni ed elevata affidabilità, ottimizzati per le massime capacità. Nel periodo 2013-14, il CERN avvia una fase di arresto programmato per prepararsi alla fase Run 2. Durante questo periodo, l’organizzazione procede all’upgrade dei suoi sistemi di archiviazione, aggiungendo array di JBOD 4U a 24 alloggiamenti dotati di hard drive MG03SCA400 Toshiba.

Grazie a 4 TB di capacità per hard disk, ciascuno che gira a 7200 giri/minuto e riceve i dati attraverso un’interfaccia 6 GB/s, il CERN guadagna 96 TB per unità di espansione JBOD. Il tempo medio tra guasti (MTTF) degli hard disk è di 1,2 milioni di ore, che si traduce in un tasso di fallimento annualizzato (AFR) previsto dello 0,72%.

2015/2016 – Il CERN avvia la fase Run 2: crescono in modo esponenziale le esigenze di archiviazione dati

Con l’avvio della fase Run 2 nel 2015, cresce in modo esponenziale la richiesta di capacità di archiviazione dati.

CERN aggiunge nuova capacità grazie al nuovo modello 6 TB SATA di Toshiba, il MG04ACA600E. Anche in questo caso installato in un JBOD front loader 4U 24 alloggiamenti, per una capacità totale che cresce a 144 TB per unità.

Per questo modello il MTTF migliora e tocca 1,4 milioni di ore, per un AFR previsto dello 0,62%.

2018 – Toshiba Lancia il modello MG07 ad elio per portare la capacità a 14 TB per hard disk     

Dopo il 2016, Toshiba accelera lo sviluppo e l’introduzione di nuovi modelli di hard disk enterprise ad alta capacità per soddisfare le esigenze di archiviazione dati su cloud in tutto il mondo, lanciando due nuove generazioni di HDD, MG05 e MG06. La serie MG06 è resa disponibile con capacità fino a 10 TB per drive. E, malgrado utilizzi sempre una struttura ad aria, Toshiba riesce ad incrementare il MTTF a 2,5 milioni di ore, con un tasso di fallimento dello 0,35%, ad oggi il più basso nel mercato degli hard disk ad aria.

Nel caso della tecnologia di registrazione magnetica convenzionale (CMR) in un fattore di forma da 3,5”, gli HDD ad aria raggiungono un limite a 7 piatti (e dunque 10 TB) di capacità.

E se in teoria è possibile incrementare la capacità utilizzando piatti più sottili, l’aria sarebbe un gas troppo pesante, con il risultato di un severo flattering. In alternativa è possibile utilizzare la tecnologia di registrazione magnetica a strati (SMR), che richiede però una speciale gestione per evitare seri problemi di prestazioni, ed è limitata dalla necessità di ricorrere a speciali file system creati su misura per le complessità della tecnologia.

L’upgrade della capacità di archiviazione avviato dal CERN nel 2018 ha coinciso con il lancio della serie MG07 di Toshiba, che comprende i primi HDD server con capacità fino a 14 TB. Con l’acquisto della variante da 12 TB, il CERN ha raddoppiato la sua capacità per JBOD, portandola a 288 TB.

La serie MG07 incrementa la capacità senza cambiare il fattore di forma utilizzando l’elio al posto dell’aria. Questo consente l’utilizzo di piatti più sottili senza il flattering associato, fino a nove per drive.

Grazie al fatto di utilizzare la tecnologia CMR, gli hard disk MG07 possono far fronte a qualsiasi carico di lavoro senza il calo di prestazioni associato alla tecnologia SMR. Inoltre l’elio crea minore attrito dell’aria, riducendo in modo significativo l’energia richiesta per ruotare i piatti. Grazie alla precisa ottimizzazione dello spindle motor, la potenza di esercizio è stata ridotta di un terzo (da c. 11W a <7W) per il modello ad elio della serie MG07.

Per la serie MG07 il valore MTTF è incrementato in modo significativo, toccando 2,5 milioni di ore.

Le esigenze di maggiore capacità legate alla fase Run 3

Nel 2019, il LHC è stato nuovamente fermato per procedere all’installazione di ulteriori aggiornamenti, prima di riavviarlo per la fase Run 3, prevista per il 2021. Con l’accelerazione dei dati generati, è previsto un significativo incremento della domanda di capacità storage.

Come dichiarato in una nota ufficiale da Eric Bonfillou: «I prodotti e il supporto di Toshiba hanno saputo soddisfare i severi requisiti del CERN. In termini di potenza di calcolo e capacità storage, la nostra infrastruttura IT si è dimostrata all’altezza delle esigenze di calcolo scientifico, utilizzando al massimo gli hard disk ad alta capacità e affidabilità di Toshiba».

Il lancio pianificato da parte di Toshiba di drive basati su tecnologia CMR (registrazione magnetica convenzionale) e SMR (registrazione magnetica a strati) che utilizzano lo stesso fattore di forma da 3,5” consentirà al CERN di accedere ai drive 16 TB e 18 TB, aggiungendo dunque 432 TB di nuova capacità per JBOD.

Per Larry Martinez-Palomo, General Manager della Business Unit HDD di Toshiba Electronics Europe: «I prodotti Toshiba sono idonei per lo storage su larga scala nei centri dati e la riuscita installazione e gestione di tre generazioni di HDD enterprise di Toshiba presso il CERN, in un ambiente IT molto complesso, costituisce un parametro di riferimento perfetto».