Storage area network

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken

Een Storage Area Network is een toegewijde IT-infrastructuur, bedoeld voor transport van het SCSI-protocol tussen rekencentrumcomputers en een geconsolideerde opslagvoorziening. Het geheel van middelen dat gezamenlijk de geconsolideerde opslagvoorziening vormt, wordt vaak SAN genoemd, maar dit is feitelijk onjuist. Een SAN is (net zoals een LAN) een infrastructuur t.b.v. datatransport. In het Nederlands bestaat geen korte term voor geconsolideerde dataopslag. Om deze reden wordt verder in dit artikel de Engelse term "Storage" (= opslag) gebruikt.

Historie[bewerken]

Rond 1985 deed het LAN haar intrede, met als centrale component een bestandsserver (of 'Fileserver'). De bestandsserver heeft maar een beperkte inbouwruimte voor harde schijven. Harde schijven werden zodoende ondergebracht in externe behuizingen en ook werden meerdere fileservers in het LAN geplaatst. Deze ontwikkeling had een negatieve weerslag op een aantal essentiële kwaliteitsattributen zoals snelheid, capaciteit, betrouwbaarheid en beheerbaarheid. Daarnaast was er ook sprake van inefficiëntie, vanwege fragmentatie van de vrije opslagruimte (veel losse harddisks die allemaal afzonderlijk een stuk vrije ruimte hebben).
Zodoende is de industrie begin negentiger jaren op zoek gegaan naar een oplossing. Dit initiatief leidde tot de ontwikkeling van "storage" (destijds SAN genoemd) en de introductie ervan in 1994.

Storage[bewerken]

"Storage" bestaat uit de volgende onderdelen:

  • SAN: (zie introductie bovenaan)
  • Host Bus Adapter (HBA): de Fibre Channel interface in de servers
  • Storage controllers: de besturingseenheid tussen dataopslagmedia, SAN en LAN.
  • disk enclosure: de diskkabinetten als behuizing voor de harde schijven
  • harde schijven of SSD's: de media voor dataopslag

Rol en functies van de afzonderlijke onderdelen[bewerken]

SAN[bewerken]

Een Storage Area Network is een IT-infrastructuur, bedoeld voor transport van het SCSI- protocol tussen servers en "Storage". Fysiek bestaat het SAN uit switches en optische Glasvezelkabels. om het SCSI- protocol geschikt te maken voor transport over dit medium wordt het ingekapseld in het Fibre Channel-protocol. SAN's zijn verkrijgbaar in transportsnelheden van 2, 4, 8 en 16 Gbps. Het SAN is niet rechtstreeks toegankelijk voor apparatuur op het LAN, maar een LAN kan wel het FC protocol transporteren (dit heet: FCoE).

HBA[bewerken]

De "Host Bus Adapters" (HBA) zijn de uitbreidingskaarten in de centrale servers, die door het besturingssysteem van de server herkend worden als harde-schijf-interfaces.

Storage controller[bewerken]

De controller voert binnen een "storage" oplossing, centraal de regie en is om deze reden aangesloten op alle drie de IT-infrastructuren: het SAN via Glasvezel-bekabeling, het LAN (via UTP-bekabeling en de diskkabinetten (via SAS-bekabeling). De "storage controller" is primair verantwoordelijk voor:

  • verdeling van de harde schijven in RAID-groepen voor fouttolerantie.
  • de definitie van de fysieke en virtuele volumes die als LUN worden aangeboden aan de computers.
  • het aanbieden van NAS-functies op het LAN.

Disk Enclosure[bewerken]

Dit zijn de diskkabinetten die de energievoorziening en de datacommunicatie verzorgen voor en naar de harde schijven. Er bestaan diskkabinetten voor harddisks van verschillende maten en interfacetypen. Het diskkabinet is geschikt voor inbouw in standaard 19 inch computerrekken.

Fouttolerantie[bewerken]

De "Storage" oplossing neemt een centrale rol in binnen de ICT-infrastructuur. De "Storage" oplossing is niet alleen verantwoordelijk voor de opslag van alle data (bestanden en databases), maar ook van de virtuele machines, die feitelijk grote bestanden zijn. Het is daarom van groot belang dat de "Storage" oplossing fouttolerant is. Onderdelen en componenten moeten redundant worden uitgevoerd, zodat defecten worden opgevangen. Bekende technieken hierbij zijn: RAID, Load balancing en Clustering. Toepassing van al deze technieken tezamen zorgen voor een hoge beschikbaarheid van de "Storage" oplossing, wat resulteert in weinig dataverlies en snel herstel in geval van defecten. Deze worden uitgedrukt in de termen: RPO en RTO.

MetroCluster concept[bewerken]

Een MetroCluster is een volledig redundante "Storage" oplossing

NetApp MetroCluster with Backup

RAID DP[bewerken]

Een RAID groep is een fouttolerante set van harddisks. RAID-DP staat voor RAID "Double Parity" en is een variant op RAID-6. RAID-DP verschilt van RAID-6, zoals RAID-4 van RAID-5 verschilt. Zowel bij RAID-4 als PAID-DP wordt er met toegewijde pariteit schijven gewerkt, i.p.v. het distribueren van de pariteitsblokken over de gehele set. Door toepassing van WAFL ("Write Anywhere File Layout"), worden alle schijven synchroon beschreven, waardoor alle schijven in de RAID set gelijkmatig belast worden. Deze aanpak heeft als voordeel dat uitbreiding van de RAID set is nu mogelijk door (gedurende normaal bedrijf) een disk bij te plaatsen, zonder dat de data opnieuw gedistribueerd hoeft te worden over de nieuwe RAID groep, een proces dat tijdrovend, foutgevoelig en prestatie verlagend is.

Plex en Aggregate[bewerken]

Een "Plex" is een collectie RAID groepen. Voor de toepassing van "Syncmirror" worden twee "plexes" gecreëerd: Plex0 en Plex1. Deze moeten schijven bevatten uit een unieke ‘disk pool’, welke ook de "hot spare" schijven bevat. Bij een metrocluster bestaat een "Mirrored Aggregate" uit 2 geografisch gescheiden "plexes".

WAFL[bewerken]

WAFL ("Write Anywhere File Layout") is een software component van het NetApp besturingssysteem: ‘ONTAP’. WAFL bestaat uit twee lagen. Eén laag voor de (logische) bestandsgeoriënteerde zaken (zoals NFS, CIFS, http en FTP) en één laag voor de (fysieke) blokgeoriënteerde zaken (zoals, LUN’s en diskprotocollen als: FC, ATA en SCSI). De laatstgenoemde laag is tevens verantwoordelijk voor zaken als RAID, klonen, spiegelen en het vervaardigen van ‘snapshot’ kopieën.

Snapshot kopie[bewerken]

Een snapshot kopie is geen echte fysieke kopie maar slechts een punt-in-de-tijd markering binnen de actuele en operationele dataset. Hierdoor neemt de kopie geen extra ruimte in beslag. Dit maakt snapshot kopieën snel en ruimtebesparend. Snapshots kunnen gemaakt worden met een interval vanaf 1 minuut, waarbij afzonderlijke snapshots op luwe momenten weer kunnen worden samengesmeed tot snapshots met grotere intervallen.
Snapshots zijn (in tegenstelling tot SnapVault) niet te gebruiken om vorige versies van individuele bestanden terug te zetten, omdat snapshot kopieën alleen ingesteld kunnen worden op het niveau van hele volumen of ‘aggregates’. Snapshots zijn ideaal bij het aanbrengen van risicovolle wijzigingen zoals updates van applicaties, databases en servers.

SnapProtect[bewerken]

NetApp SnapProtect is een softwaresuite met protectie software t.b.v. Disaster Recovery, Backup en archivering op basis van het principe van zgn. ‘snapshots’. SnapProtect bestaat uit de onderdelen: SnapVault, SnapMirror, SnapLock en SnapRestore.

SnapVault[bewerken]

Bij SnapVault worden map-structuren (‘qtrees’) vanuit een ‘Source Volume’ asynchroon gerepliceerd naar ‘Destination Volume’. Doorgaans worden meerdere map-structuren binnen één volume gecomprimeerd en gededupliceerd en dan gearchiveerd en bijgewerkt op basis van differentiële data. Zo blijven de kopieën compact en de overdrachtssnelheid hoog. De data van het ‘Destination Volume’ is niet te wijzigen en alleen te lezen. Indien het ‘Destination Volume’ zich binnen een ‘Plex’ bevindt op een fysiek andere locatie kan SnapVault dienst doen als volwaardige backup voorziening die veiliger, sneller en praktischer is dan menig klassieke backup methode op tape en disk.

SnapRestore[bewerken]

Voor het terugkeren naar in het verleden gemaakte Snapshots wordt SnapRestore gebruikt. Omdat dit technologisch niets anders is dan het terugzetten van een markeerpunt is het uitvoeren van SnapRestore slechts een kwestie van seconden. SnapRestore is hierdoor ideaal voor: het herstellen van databases, het ongedaan maken van virusaanvallen en het terugkeren naar nulpunt instellingen bij testen.

SnapLock[bewerken]

SnapLock volumen zijn vergelijkbaar met WORM (Write Ounce Read Many), zoals bij optische ROM schijven. Het hoofddoel is archivering van data voor een langere periode. Voor grote hoeveelheden data waar een bewaarplicht voor geldt is SnapLock een ideale oplossing, omdat de gearchiveerde data on-line beschikbaar blijft. Een goed voorbeeld zijn b.v. tomografische beelden van CT en MRI scans. Het bijzondere bij SnapLock volumen is echter dat bestanden wel toegevoegd kunnen worden en na het verlopen van de vooraf ingestelde retentie periode, weer kunnen worden gewist. Op deze wijze blijft het archief compact en actueel.

SyncMirror[bewerken]

SyncMirror is het middel dat het NetApp MetroCluster fouttolerant maakt. De architectuur uit Figuur 1 is fouttolerant voor het defect raken en/of uitval van elk willekeurig onderdeel. SyncMirror spiegelt naast de datablokken ook het ‘Non Volatile RAM’ van de controllers. Hierdoor is het mogelijk, bij verlies van één van de clusterzijden, onderbroken WAFL transacties alsnog af te ronden op de overgebleven operationele zijde. Omdat de replicatie synchroon is, geldt er een afstandsbeperking van 200km.

SnapMirror[bewerken]

SyncMirror maakt het gebruik van SnapMirror in principe overbodig. Een reden om toch SnapMirror in te zetten binnen een SyncMirror MetroCluster is als men data wenst te repliceren naar een derde bestemming. SnapMirror is het asynchroon repliceren van volumes of afzonderlijke map structuren (qtree). Omdat de replicatie asynchroon is, zijn er geen afstandsbeperkingen tussen bron en bestemming. In tegenstelling tot SnapVault kan SnapMirror gebruikt worden als Disaster Recovery oplossing, omdat de rollen van bron en bestemming omgedraaid kunnen worden.

Tiebreaker[bewerken]

De Tiebreaker verzorgd de trigger voor de fail-over van componenten. Om volledige autonomie te realiseren wordt de Tiebreaker functionaliteit bij voorkeur op een 3e locatie geïmplementeerd. Het fail-over proces verloopt altijd automatisch, ongeacht hoe het proces gestart werd, via de Tiebreaker functie of via een handmatig commando.

zie ook[bewerken]

iSCSI