In questi giorni un nostro cliente sta valutando la scelta di un nuovo “file storage” da aggiungere all’attuale infrastruttura storage che ormai ha raggiunto la soglia di 300 Terabyte di spazio. Come rispondere a questa richiesta? Be, lo scopo di questa breve guida è proprio quello di capire perché è importante uno storage di livello enterprise in azienda, ed in particolare di un “file storage”.
Cos’è uno storage enterprise
Ti sei mai chiesto cos’è uno storage enterprise? Quando si parla di storage in italia si immagina la memoria del telefonino o quella del proprio hard disk a livello di PC. Già il pc si avvicina di più, ma non è assolutamente la stessa cosa. A livello aziendale non è così facile, in italia, c’è gente che porta via i file dall’azienda in un hard disk e chiama quella una politica di backup, oppure ci sono aziende con singolo un server e dicono che lo storage è il disco dentro al server (ci avviciniamo ancora di più rispetto al pc ma non ci siamo ancora) non è facile dirti con parole semplici cosa è uno storage e quali problemi va a risolvere, ma voglio esser diretto e te lo spiegherò comunque in modo semplice e intuitivo.
Lo storage è il cuore dei datacenter aziendali, in pratica è un contenitore di dati, un insieme di dischi rigidi che lavorano assieme e sono supportati da una memoria e comandati da una CPU. Il tutto molto sicuro e con alimentatori doppi, solitamente due “controller” ovvero schede madri che controllano i dischi. I dischi danno spazio disco e prestazioni alla macchina e quindi a tutta l’infrastruttura IT, per cui ad esempio se ho un database questo è bene che stia su dischi SSD, se ho una miriade di file ed ho bisogno di spazio è bene utilizzare dischi SATA, se ho bisogno di performance migliori dei dischi sata utilizzo i dischi SAS.
Diciamo che lo storage è il forziere con dentro i dati aziendali che vanno tenuti protetti al sicuro per anni senza che nessuno possa entrare e far danni. La seconda parola “enterprise” significa che è costruito per durare nel tempo considerando che sono macchine accese 24 su 24 per 4/5 a volte anche 6 anni (prima che vengano sostituite). Immagina la navicella spaziale enterprise di Star Trek, adesso non è che lo storage ti porta in altri mondi, ma sicuramente ti permette di star al sicuro e navigare con la certezza di mettere i tuoi dati su una piattaforma di un altro livello rispetto alle capsule spaziali o navicelle classiche.
Fin qui ti è tutto chiaro? Bene, ora le cose diventano un pochino più articolate, perché esistono diversi tipi di storage Enterprise e in particolare le 3 principali categorie sono:
- Storage a blocchi (protocolli FC / iSCSI);
- Storage per file (NFS, SMB);
- Storage ad oggetti (HTTP, API).
Vediamo le caratteristiche di questi 3 tipi di storage in contesti precisi e in quali problemi vanno ad indirizzare.
Storage a blocchi
E’ lo storage classico, lo storage a blocchi. Ovvero la prima tipologia nata sul mercato, uno storage dove sono richieste performance e generalmente utilizza tutte le tipologie di dischi sopra descritte, ma principalmente si usano dischi SAS, SATA e soprattutto SSD. Il collegamento verso gli host avviene con interfacce in FC o ISCSI (rame o fibra), questo garantisce solitamente alte performance per il collegamento agli switch e di conseguenza ai server stessi dotati di apposite schede HBA.
Lo storage a blocchi classico è ancora il pilastro su cui è basata la comune infrastruttura IT aziendale, partendo dai server, passando per gli switch, si arriva allo storage. Il vantaggio di una macchina di questo tipo è quello di gestire fino a qualche Petabyte (1 Petabyte = 1000Terabyte) senza problemi e presenta latenze (tempi di lettura/scrittura) molto basse con un elevato e quindi un elevato numero di letture e scritture per secondo (IOPS).
I principali leader di mercato hanno prodotti nati come storage a blocchi, alcuni produttori hanno anche integrato oltre alla parte a blocchi anche quella “file storage” in una stessa macchina (con i pregi e i difetti di questa scelta, perché se da una parte ho tutto in un prodotto dall’altra un prodotto specializzato in una soluzione che fa bene solo quella è buona cosa).
Storage ad oggetti
Hai presente le grandi applicazioni distribuite che accedono a milioni di file da qualsiasi dispositivo? Bene quello che sta dietro a quel caso d’uso è uno storage ad oggetti. Ti faccio un esempio semplice per capire meglio. Apple, piuttosto che Facebook, tramite le loro applicazioni, permettono di accedere a tantissimi file da ogni dispositivo e viene data la possibilità di memorizzare dati, documenti, fotografie ecc. Perché “storage a oggetti”? Perché quando carichi ogni singolo file sulla tua applicazione, a questo vengono associati tutta una serie di parametri che poi verranno richiamati nell’arco del tempo (es. Facebook ti fa vedere un anno fa dov’eri).
Pensa ad esempio a cosa può esser fatto con uno storage di questo tipo, le possibilità sono infinite, ma il parametro che è fondamentale è che si possono gestire diverse centinaia di petabyte di storage senza problemi con la giusta architettura.
E quindi, cos’è in pratica un oggetto? Un oggetto è sinteticamente racchiude sia metadati ovvero dei dati che possono esser ad esempio l’ora in cui è stata scattata una fotografia, piuttosto che il luogo e altre informazioni utili ed un identificativo univoco globale.
File Storage
Hai presente un disco esterno con una porta di rete? Esemplificando al massimo quello è un NAS (network attached storage), principalmente viene chiamato “File Storage” in ambito Enterprise perché queste tipologie di storage servono a memorizzare in rete locale o confinata all’interno del datacenter una grande quantità di file.
Cosa utilizzo per accedere al “file storage”? Nient’altro che un semplice PC collegato alla stessa rete del NAS. I protocolli per collegasi a questi storage infatti sono SMB o NFS (Network File Protocol).
In pratica una volta che hai collegato il tuo computer alla rete, ti basta inserire l’indirizzo del NAS e ti crei una cartella sul desktop dalla quale posso memorizzare i file sullo storage condiviso sulla rete.
Questo tipo di storage è quello che ci ha chiesto di implementare il cliente a fianco ad un installazione già presente, ovviamente non stiamo parlando di pochi terabyte ne tanto meno di un ambiente di test, qui si parla di un ambiente in produzione e di ambienti fondamentali per la vita dell’azienda.
Ovviamente prima di proporre qualsiasi offerta, come fa sempre Cinetica, i nostri tecnici hanno analizzato tutta la situazione e costruito un progetto con una delle migliori soluzioni possibili, ovvero in questo caso d’uso specifico, quella di proporre un storage a file indipendente dall’hardware che sia quindi guidato dal software e completamente indipendente dal resto dell’infrastruttura IT.
Questo ti permette di:
- Non dover spendere dei soldi in hardware che è costoso e comunque va mantenuto per anni;
- Riutilizzare dei server e una soluzione fatta di virtual machine molto consistente
- Dare accesso al file server in modo del tutto indipendente dallo storage, nel senso che visto che l’architettura ha più nodi, qualora se ne rompe uno il dato è sempre accessibile da un altro nodo.
Lo svantaggio è, che è facile uscire dalle matrici e c’è un rischio di minor stabilità dell’infrastruttura se il progetto non è fatto come si deve.
Detto questo, ti farò sapere come si evolve questo progetto con un successivo articolo riguardante questo tema una volta installata la soluzione dal nostro cliente.
buona giornata,
Luca.