Nella continua ricerca che facciamo per trovare prodotti all’avanguardia nell’ambito della virtualizzazione e dello storage la settimana scorsa abbiamo fatto un incontro tecnico/esplorativo in IBM. L’obiettivo principale era quello di capire meglio e più da vicino due prodotti: XIV e SVC (di cui scriverò più avanti).

In linea di massima stiamo cercando di capire meglio tutto quello che ci sta intorno per poter dare le migliori risposte ai nostri clienti e soprattutto, visto che non esiste un prodotto assolutamente migliore, la miglior soluzione per ogni problema specifico. (siamo bravi è? ogni tanto me la canto 😀 )

Il prodotto è interesante, più interessante di quanto letto fino ad oggi su internet… spesso è stato bistrattato ma l’ho trovato meglio di quanto mi aspettassi. E’ sicuramente immaturo, questo bisogna dirlo, ma ha anche ottime possibilità di crescita, sicuramente, chi lo ha progettato è uno che di storage se ne intende 😉

L’architettura è basata su hardware standard (e questo mi piace molto):

Sono un massimo 15 cassetti (non è ulteriormente espandibile), ogni cassetto porta 12 HD SATA da 1TB e un controller con una CPU quad core intel e 8 GB di cache, l’interconnessione del cassetto avviene con 4 link GBit Ethernet (!).

Tutti i cassetti sono collegati a due switch gigabit ethernet (per la ridondanza) che portano in totale ad una banda di 120Gbit/sec.

La macchina può avere fino a 24 porte FC e 6 porte iSCSI.

Poi ci sono 3 unità UPS che servono a garantire, probabilmente, il de-caching dei dati verso i dischi nel caso di una mancanza di corrente.

200904071241.jpg

La prima cosa che stupisce è la grande quantità di cache (120GB) e il fatto che il sistema lavora solo con dischi SATA in modalità RAID1. La scelta è radicale, forse è anche troppo radicale, alla riunione hanno vociferato di una futura versione che potrebbe supportare RAID 6 ma a quel punto sarà da capire se i controller staranno dietro alla grande quantità di calcoli necessari per gestire la parità. Sempre in quell’occasione mi hanno spiegato che sono state fatte prove con HD FC ma le performance non cambiavano tanto per via dell’architettura… non faccio fatica a crederlo visto il tipo di backend.

L’implementazione del RAID 1 è fatta con dei blocchi standard da 1MB che vengono sparpagliati su tutti i cassetti, questo garantisce massima affidabilità ed anche le massime prestazioni, a modo sua implementa il wide striping. Il tipo di architettura permette anche di avere tempi di ricostruzione dei dischi molto veloci tipico però di tutti i sistemi dell’ultima generazione che implementano wide striping (tanti dischi che scrivono sull’hot spare permettono di minimizzare lo stress sulle lun coinvolte e di abbattere i tempi di ricostruzione)

IBM dice che è tutto molto bilanciato e performante… io ci posso credere ma sarebbe da provare sul campo con dei benchmark reali su applicazioni reali…. non sono riuscito ad avere nulla a proposito ma ci siamo lasciati per un eventuale secondo incontro per verificare alcune cose in laboratorio.

Le cose che mi piacciono di più

Hardware standard: questo è sempre un bene… vuol dire che possono dedicare più tempo a sviluppare le funzionalità softaware.

Una bella interfaccia grafica: non c’e’ che dire: molto scenografica (ricorda il doc del Mac OS X), scritta in Java, facile da usare e, più o meno, riesci a fare tutte le operazioni senza troppa difficoltà… il risultato è un tempo di apprendimento veloce e una facilità d’uso generale non complicata.

Snapshot: Usa un meccanismo di snapshot a puntatori molto efficiente (diciamo di ultima generazione) che non ha necessità di preallocare spazio e garantisce un numero di snapshot molto alto senza perdite di prestazioni.

Thin provisioning: il thin provisioning è embedded nell’architettura ma mi sembra limitato non permette di fare “space reclamation” e non mi hanno spiegato bene i dettagli di implementazione, approfondiremo…..

No licenze aggiuntive: la macchina non prevede licenze aggiuntive particolari quindi tutte le funzionalità sono abilitate e utilizzabili da subito.

Le cose che mi piacciono di meno

Replica dei volume in remoto: non esiste, è una pecca grossa che spero venga risolta in futuro.

Scalabilità limitata: muore con i suoi begli 80 TB utili poi ne devi prendere un altro…

Immaturità: non c’è dubbio che c’è molto da fare…. è proprio una versione 1.0!

Per cosa si dovrebbe usare?

Bulk Storage, File server, Web serving, Virtualizzazione, Archiving, insomma tutte quelle applicazioni che non necessitano di prestazioni troppo spinte e che, in qualche modo, possono giustificare l’utilizzo dei SATA…. soprattutto grazie alla grande cache.

Per cosa non si deve usare?

DB e applicazioni che lavorano con un alta percentuale di accessi random al disco in genere: sicuramente non mi sembra la macchina adatta.