RAID

Bij het berekenen van de RAID staat voor Redundant Array of Independent Disks, Redundant Array of Independent Disks, is een techniek waarin verscheidene harde schijven aangesloten op een computer die ze bruikbaar zijn voor de toepassingen en de gebruiker maakt, alsof het een enkel volume opslag. Deze aggregatie exploits, met verschillende middelen volgens de soort toepassing, de beginselen van gegevens- en parallellisme in hun toegang tot, ten opzichte van een enkele schijf, prestatieverbeteringen, toename in opslagcapaciteit, verbetering van tolerantie storingen.

De RAID is een techniek die standaard gebruikt in de servers en werkstations die grote volumes of krachtige gegevensopslag vereisen, bijvoorbeeld een data base of een aanbrengplaats van digitale video of audio tegemoet. RAID wordt vaak gevonden in de NAS en ook steeds vaker in opslagsystemen voor blade-architecturen.

Geschiedenis

De term RAID werd voor het eerst geïntroduceerd in 1988 door David A. Patterson, Garth A. Gibson en Randy H. Katz in artikel A Case voor Redundant Arrays of Inexpensive Disks gepubliceerd in de Proceedings van SIGMOD Conference. De huidige op een systematische manier een deel van de technologie geïntroduceerd in het vorige decennium, aggregeren ze onder het acroniem voor Redundant Array of Inexpensive Disks, in het Italiaans Redundant Array of goedkope schijven, en hen te identificeren met nummers van 1 tot 5, die vandaag de dag bekend staan ​​als "niveaus auteurs "RAID. Het eerste patent werd in 1977 ingediend door Norman Ken Ouchi IBM presenteren van wat nu bekend staat als niveau 4. De betekenis van de brief "I" in de titel is te wijten aan het feit dat in de jaren '80, in tegenstelling tot vandaag de dag, de belangrijkste factor Deze technologie was de mogelijkheid om een ​​combinatie van verschillende schijven goedkoop en achterhaald om het systeem een ​​betere algemene generatie schijf voor de capaciteit, betrouwbaarheid en snelheid te maken.

RAID-implementaties

Data striping

De data wordt verdeeld in segmenten van gelijke lengte en geplaatst op verschillende schijven. De grootte van de partitie wordt striping unit. Scheidingswanden worden gewoonlijk verdeeld over de schijven met behulp van een round robin algoritme.

Wanneer de omvang van de gevraagde data is superieur aan een eenheid van strepen, worden de gegevens verdeeld over meerdere schijven en kan worden gelezen in samenhang betere prestaties. Bijvoorbeeld als we een eenheid van striping van 1 bit en we hebben een array van schijven D, datasequenties D bits lang of meer, vereisen alle schijven.

Economische of onafhankelijke

Hoewel de "I" RAID nu algemeen betekent onafhankelijk plaats van goedkope, één van de voordelen van de oorspronkelijke RAID was het gebruik van goedkope apparatuur en blijft geldt in vele situaties, met name wanneer zij worden gebruikt IDE / ATA of SATA.

Vaker echter onafhankelijk SCSI schijven worden gebruikt, hoewel de kosten van dergelijke schijven is veel kleiner dan het systeem dat de RAID vervangt het algemeen.

Hardware of software

RAID kan worden uitgevoerd, hetzij door speciale hardware en met speciale software van de hardware in gemeenschappelijk gebruik.

Met een software-implementatie, het besturingssysteem beheert de set van schijven met een normale controller. Deze optie kan langzamer dan hardwareINVAL, maar niet de aankoop van extra componenten.

Een hardware-implementatie van RAID is een RAID-controller ad hoc. Desktop computers, dit kan een PCI-uitbreidingskaart zijn, of u kunt de controller op het moederbord. In RAID groter, worden de controllers en schijven geplaatst in een externe behuizing. Deze schijven kunnen worden ATA, SATA, SCSI of Fibre Channel, terwijl de controller wordt aangesloten op de host-computer met een of meer snelle verbindingen SCSI, Fibre Channel of iSCSI-verbindingen, hetzij direct of als NAS. Deze controller beheert de schijven, en voert de pariteit controles.

Deze optie heeft de neiging om de beste prestaties te geven en het beheer in het besturingssysteem veel gemakkelijker. De hardware-implementaties ondersteunen meestal hot-swapping, zodat u een schijf te vervangen terwijl het systeem actief is.

Zowel de hardware en software die het gebruik van hot-spare schijven vooraf geïnstalleerd die onmiddellijk worden gebruikt wanneer een andere schijf uitvalt.

Standaard RAID-niveaus

Overzicht van de meest voorkomende RAID-niveaus

RAID 0

De RAID 0 splitst gegevens gelijkmatig over twee of meer schijven zonder pariteitsinformatie of redundantie. Opgemerkt wordt dat de RAID-0 niet aanwezig was bij de oorspronkelijke RAID-niveaus en die niet redundant. RAID-0 wordt meestal gebruikt om de prestaties van het systeem te verhogen, hoewel het zeer nuttig om een ​​klein aantal grote virtuele schijven creëren van een groot aantal kleine fysieke schijven. Hoewel RAID-0 niet is vermeld in de oorspronkelijke RAID-niveaus, in een ideaal systeem voor RAID-0 disk I / O ik zou splitsen in blokken van gelijke grootte en zou eveneens van toepassing op alle schijven.

De implementaties van RAID-systemen 0 meer dan twee schijven zijn mogelijk, maar de betrouwbaarheid van een bepaald RAID-0 is gelijk aan het gemiddelde betrouwbaarheid drives gedeeld door het aantal schijven aanwezig. Dus de betrouwbaarheid, gemeten als gemiddeld storingsvrij is omgekeerd evenredig met het aantal elementen; dat wil zeggen een systeem met twee schijven betrouwbaar helft van slechts een schijf. De reden waarom dit gebeurt is dat het bestand wordt verdeeld tussen alle schijven. Als een schijf uitvalt, kan het bestandssysteem niet omgaan met een verlies van gegevens zo groot omdat de data wordt verdeeld over alle schijven. De gegevens kunnen vaak worden hersteld met een tool, hoewel het zeker onvolledige en beschadigd zal worden.

RAID-0 is erg handig voor het creëren van grote NFS servers op één plaats, in de gevallen waarin de montage veel schijven is duur of onmogelijk en redundantie is niet relevant. Het wordt ook gebruikt wanneer het aantal schijven wordt begrensd door het besturingssysteem. In Microsoft Windows, is het aantal letters van de schijven beperkt tot 26, waardoor de RAID-0 is een populaire manier om een ​​groter aantal schijven te gebruiken. Aangezien er geen redundantie wordt de data gedeeld tussen de schijven en de schijven kan niet worden vervangen omdat zij allemaal afhankelijk van elkaar. Dit type van ontwerp is eigenlijk geen echte RAID, want er is geen redundantie.

  • Voordelen: economische kosten van de uitvoering naar beneden, hoge prestaties lezen en schrijven.
  • Nadelen: Kan niet worden geïnstalleerd hot-spare schijven, lagere betrouwbaarheid van een enkele schijf, is niet fouttolerant.

Aaneenschakeling

Hoewel een aaneenschakeling van schijven is niet één van de RAID-niveaus, is een populaire methode voor het combineren van meerdere fysieke schijven in een groot virtueel station. Zoals de naam al aangeeft, het is gewoon een aaneenschakeling van schijven, om te laten lijken op de set als één schijf.

In die zin is de aaneenschakeling is een manier om de afscherming te keren. Terwijl partitionering neemt een enkele fysieke schijf en creëert een of meer logische stations, de keten maakt gebruik van twee of meer fysieke schijven om één logische schijf te maken. Zelfs de aaneenschakeling, zoals RAID 0, in het geval van breuk van een disc onbruikbaar maakt de volledige schijf array. In dit geval echter, data herstel iets 'waarschijnlijker dan RAID 0 omdat de gegevens lineair geschreven alsof het een harde schijf met een aantal slechte blokken als de grootte van de harde schijf beschadigd.

Om deze reden is een reeks goedkope schijven kan worden genoemd, en kan worden gezien als een verre verwant van de RAID. De aaneenschakeling is soms nuttig om een ​​set schijven van verschillende afmetingen te transformeren in een logische schijf bruikbare afmetingen. Vervolgens kan de aaneenschakeling gebruiken schijven van 3 GB, 15 GB, 5,5 GB en 12 GB aan één logische schijf Om vanaf 35,5 GB zeker nuttiger dan individuele schijven afzonderlijk.

In Linux 2.6 wordt gedefinieerd als RAID

Aaneenschakeling of JBOD

JBOD is een acroniem dat staat voor Just a Bunch of Disks of gewoon een stel schijven. De JBOD term wordt vaak losjes gebruikt als synoniem voor "aaneenschakeling", terwijl het in feite zou betekenen de schijven zijn daar ook geplaatst. Aangezien het gebruik niet kan worden opgevat als een van beide disk groep toegankelijk individueel of groep schijven zichtbaar is als een keten.

De juiste definitie van JBOD disk groep is nog steeds toegankelijk afzonderlijk. De juiste term voor de aaneenschakeling te definiëren is SPAN.

RAID 1

De RAID 1 zorgt voor een exacte kopie van alle gegevens op twee of meer schijven. Het is nuttig wanneer redundantie belangrijker is dan het gebruik van alle schijven om hun maximale capaciteit: in feite het systeem kan een capaciteit gelijk aan die van de kleinste schijf hebben. In een ideaal systeem, gevormd door twee schijven, de betrouwbaarheid toe met een factor twee in vergelijking met een enkele disk systeem, maar het is mogelijk om meer dan één kopie van de schijven te verkrijgen. Omdat elke schijf onafhankelijk kunnen worden gebruikt als de andere mislukt, betrouwbaarheid lineair toeneemt met het aantal schijven aanwezig. RAID-1 verhoogt ook de leesprestaties, aangezien veel implementaties kunnen lezen van een schijf, terwijl de andere bezig is.

Een veel voorkomende praktijk is om een ​​spiegel van een extra schijf die kan worden gedeeld door de oorspronkelijke RAID-systeem en worden onafhankelijk van elkaar gebruikt te maken. In sommige implementaties, kunnen deze extra spiegel worden verdeeld en toegevoegd stapsgewijs, in plaats van dat een volledige ombouw van de RAID.

  • Voordelen: betrouwbaarheid die lineair toeneemt met de spiegel geïmplementeerd, fouttolerantie, lezing verband met de schijf sneller dan de RAID-structuur.
  • Nadelen: overhead verbonden met de spiegel, lage schaalbaarheid, hoge kosten, het schrijven verband met de schijf langzamer dan RAID structuur.

RAID 2

Een RAID 2 verdeelt de gegevens op bit-niveau en maakt gebruik van een Hamming code voor foutcorrectie die fouten van de individuele bits kunnen corrigeren en detecteren dubbele fouten. Deze schijven worden gesynchroniseerd door de regelaar, zodanig dat de kop van elke schijf in dezelfde positie op elke schijf. Dit systeem blijkt zeer efficiënt in omgevingen waarin zij voorkomen een aantal fouten lezen of schrijven, maar in omgevingen hogere prestaties, gezien de hoge betrouwbaarheid van de schijven, het RAID 2 wordt niet gebruikt. Vandaag de RAID-2 is in feite beschouwd als achterhaald.

RAID 3

Een RAID 3 maakt gebruik van een divisie op byte-niveau met een toegewijde pariteit schijf. RAID-3 is uiterst zeldzaam in de praktijk. Een nadeel van RAID-3 is dat het meerdere applicaties tegelijk kan draaien. Dit is omdat elk datablok heeft zijn eigen definitie wijdverspreid onder alle schijven in de RAID en zich in dezelfde locatie, dus elke I / O-verzoeken om alle schijven te gebruiken.

In het voorbeeld hiernaast, zal een verzoek om blok A die u nodig heeft om door middel van alle schijven. Een gelijktijdige aanvraag voor het blok B zal in plaats daarvan in de wacht blijven.

Overtolligheid

In het geval van mislukking, u toegang tot de pariteit schijf en de gegevens worden gereconstrueerd. Zodra de defecte schijf wordt vervangen, kunnen de ontbrekende gegevens worden hersteld en de werking kan hervatten. De reconstructie van de gegevens is vrij eenvoudig. Beschouw een reeks van vijf schijven, waarin de gegevens op een diskette X0, X1, X2, X3 en X4 is pariteitschijf. De pariteit van de i-de bit wordt als volgt berekend:

Neem aan dat de fout interesseert X1. Als we de exclusieve OR ⊕ X1 uit te voeren om X4 met zowel de leden van de vorige vergelijking krijgen we:

Aldus kan de inhoud van de informatiestrook op X1 hersteld van de inhoud van de stroken die overeenkomen met de andere schijven in de array. Dit principe blijft in RAID-niveaus hoger.

RAID 4

De RAID-4 maakt gebruik van een divisie block-level met een toegewijde pariteit schijf. De RAID-4 is vergelijkbaar met RAID-3 behalve dat de data verdeelt op blokniveau plaats op byteniveau. Hierdoor kan elke schijf behorende tot het systeem op onafhankelijke wijze wanneer het nodig is een blok. Als de schijf controller het toelaat, kan een RAID-4 verschillende lees- verzoeken tegelijk dienen. Bij het lezen van de overdracht van vermogen is vergelijkbaar met RAID 0, wordt schriftelijk bestraft.

In het voorbeeld tegenovergestelde zou een verzoek blok A1 wordt onderhouden door disk 1. Gelijktijdige verzoek blok B1 zou moeten wachten, maar een verzoek B2 blok kan worden bediend tegelijk.

  • Voordelen: Fault Tolerant, snel lezen, met een parallelle structuur, de mogelijkheid om schijven te plaatsen hot spare.
  • Nadelen: De schijf voor de pariteit kan de bottleneck van het systeem, het schrijven langzaam vanwege wijzigingen en pariteitsberekening.

RAID 5

RAID 5 maakt gebruik van een uitsplitsing van de gegevens op blokniveau, verspreiden pariteit gegevens gelijkmatig over alle schijven die er deel van uitmaken. Het is een van de meest populaire implementaties, zowel in software als in hardware, waarbij vrijwel elk apparaat geïntegreerd opslagmogelijkheden van RAID-5 in zijn mogelijkheden.

In het onderstaande voorbeeld, zou een verzoek om blok A1 worden onderhouden door de schijf 1. Een gelijktijdige aanvraag voor blok B1 zouden moeten wachten, maar een gelijktijdige aanvraag blok B2 zouden gelijktijdig worden bediend.

Elke keer dat een data blok in de schijf systeem moet worden geschreven, is een pariteit blok gegenereerd binnen de streep .. Als een ander blok, of een deel van hetzelfde blok, is geschreven in dezelfde streep, de pariteit blok Het wordt opnieuw berekend en herschreven. De schijf voor de opslag van de pariteit veranderd tussen de streep en de volgende; Zo is het mogelijk de pariteitblokken verdelen.

Merk op dat de pariteit blok niet wordt gelezen als lezen van gegevens van de schijf, als zou een onnodige overhead en zou de prestaties verminderen. De pariteit blok wordt gelezen, in plaats daarvan, wanneer het lezen van een sector geeft een CRC-fout. In dit geval wordt de sector in dezelfde relatieve positie in de blokken van de overblijvende data van de strook, met de pariteitsblok, wordt gebruikt om het ontbrekende blok reconstrueren. Hierdoor wordt de CRC fout wordt verborgen voor de oproepende computer. Op dezelfde wijze, als een schijf beschadigd is binnen het systeem, de pariteit blokken van de resterende schijven worden mathematisch gecombineerd de vlieg met de datablokken bleef om gegevens te reconstrueren van de defecte schijf.

Deze procedure wordt meestal aangeduid Interim Data Recovery Mode. De belangrijkste computer is niet van bewust dat een schijf beschadigd is gemaakt. Leest en schrijft naar de schijf systeem plaatsvindt stil als voorheen, maar met enige afname in de prestaties.

In een RAID 5 dat slechts één pariteit blok per streep, het falen van een tweede schijf resulteert in het verlies van alle gegevens in het systeem heeft.

Het maximum aantal schijven is theoretisch onbeperkt, maar een veel voorkomende praktijk is om het maximum aantal schijven op 14 of minder voor implementaties die alleen een pariteit blok per streep te houden. De redenen voor deze beperking is dat de kans dat twee schijven van het systeem te breken achtereenvolgens toeneemt met de toename van het aantal schijven. Wanneer het aantal schijven in een RAID-5-array groeit, kan de MTBF van het systeem als geheel nog lager dan die van een enkele schijf worden. Dit gebeurt wanneer de kans dat het een tweede schijf van de resterende verbreekt tussen de tijd opmerken, vervangen en opnieuw de eerste mislukte schijf groter wordt dan de kans dat een enkele schijf uitvalt.

We moeten niet vergeten dat de aggregatie van meer schijven in krappe ruimtes veroorzaakt toenemende temperatuur en onthult de laatstgenoemde hogere vibraties, waardoor de fouttolerantie van invloed, waardoor het risico van fouten en potentieel van de levenscyclus te verminderen. Bovendien, de schijven van dezelfde groep kocht dezelfde periode kan het einde van hun levensduur bereiken samen aanzienlijk te verlagen MTBF van het systeem. Het is een goede gewoonte, meestal gevolgd door de server fabrikanten, in RAID schijven identiek, maar van verschillende percelen, of met serienummers en / of de datum en plaats van productie onderscheiden en verre te gaan. Het is gewoon onjuist en - zoals we hebben gezien - ook tegen de vordering, die vaak wordt gevonden in sommige online veilingen of op bepaalde markten, die een paar schijven zou nemen met serienummers aaneengesloten als uitermate geschikt voor gebruik in RAID.

In implementaties met meer dan 14 schijven, of in situaties waarin u veel data redundantie nodig wordt vaak gebruikt een implementatie van RAID 5 met dubbele pariteit, die kan omgaan met gelijktijdige uitval van twee drives.

  • Voordelen: de pariteit is verdeeld, en daarom is er het probleem van de schijf knelpunt in RAID 4, de registers sneller in vergelijking met dezelfde RAID 4, omdat de schijf zoals in RAID 4 is gewijd aan pariteit nu kan worden gebruikt voor het parallelle lezingen.
  • Nadelen: geschriften langzaam als gevolg van de verandering en de pariteit berekening.

RAID 6

Een RAID 6 maakt gebruik van een split-level blokken met pariteitsgegevens verdeeld over alle schijven tweemaal. Het was niet aanwezig bij de oorspronkelijke RAID-niveaus.

In RAID-6, wordt de pariteitsblok gegenereerd en verdeeld tussen twee pariteitlijn, op twee afzonderlijke schijven met verschillende pariteitlijn in beide richtingen.

De RAID-6 is redundant RAID-5, maar is zeer inefficiënt wanneer het wordt gebruikt in een beperkt aantal schijven. Zie voor een dubbele pariteit hieronder toegelicht voor een implementatie nog overbodig.

Voordelen:

  • Hoge fouttolerantie door dubbele redundantie.

Nadelen:

  • Voeg zeer langzaam vanwege wijzigingen en pariteitsberekening nodig N + 2 schijven zeer duur economisch vanwege redundantie en complexiteit van de regelstructuur.
  • Schrijf probleem van de Hole. Het schrijven op verschillende dispositvi zijn niet atomaire geheel betekent dit dat een stroomstoring tijdens een schrijven kan leiden tot verlies van gegevens. Bijvoorbeeld een systeem met drie schijven in RAID 5, als je wilde om het slot te veranderen Nee, je moet het volgende doen: lees het blok n-1, het lezen van de pariteit berekening van de nieuwe pariteit, het schrijven van het blok n, en het schrijven van de pariteit . Het probleem is in het geval tijdens de laatste twee behandelingen waarbij de stroomvoorziening uitvalt.

Geneste RAID-niveaus

Veel schijf controllers kunnen worden genest verschillende niveaus van RAID. Dat wil zeggen, een RAID-systeem kan een als een basiselement.

RAID 0 + 1

Een RAID 0 + 1 is dat RAID wordt zowel gebruikt om het repliceren van gegevens tussen de verschillende schijven delen. Het verschil tussen RAID 0 + 1 en RAID 1 + 0 is het verschillende karakter van elk RAID-systeem. Beschouw het onderstaande voorbeeld van RAID 0 + 1: zes-schijf 120GB worden gebruikt om een ​​RAID 0 + 1 te maken.

De totale oppervlakte van 360GB is verdeeld tussen de twee systemen. Het belangrijkste voordeel is dat wanneer een schijf defect raakt tussen die van RAID-0, kunnen de ontbrekende gegevens worden overgedragen aan andere RAID-0. Echter, voeg een schijf vereist twee schijven aan de ruimte evenwicht tussen de twee systemen.

Het systeem is niet zo robuust als RAID 1 + 0 en is niet bestand tegen het gelijktijdig uitvallen van twee schijven, zij niet behoren tot dezelfde familie van RAID 0. Dat wil zeggen, als een schijf uitvalt, andere schijf een streep andere Cruciaal voor het systeem. Ook als een schijf wordt vervangen, om het systeem opnieuw op te bouwen moeten alle schijven van de RAID 0 nog steeds functionerende betrekken.

RAID 1 + 0

A RAID 1 + 0, ook RAID 10 is vergelijkbaar met RAID 0 + 1 maar RAID worden gebruikt in de tegenovergestelde. In het voorbeeld hieronder kan je drie sets van de schijven te zien tot 120 GB in RAID 1 zijn verenigd om de totale ruimte van 360 GB te bereiken.

Elke schijf van elke RAID 1-systeem kan worden beschadigd zonder gegevens te verliezen aan het systeem. Indien de defecte schijf wordt vervangen, de resterende schijf in RAID 1 is het kritische punt van het systeem. Als de schijf links zou breken, zou de informatie in het hele systeem gegevens verloren gaan.

Een schijf van 120 GB kan worden toegevoegd op elk moment in RAID 1 voor meer kracht redundantie. In tegenstelling tot RAID 0 + 1, RAID 1 sub-systemen hoeven niet gelijktijdig worden bijgewerkt.

RAID eigenaars

Hoewel alle RAID-implementaties zijn verschillend van specifieke geïdealiseerd, hebben sommige bedrijven volledig merkgebonden systemen die zijn zeer verschillend van iedereen anders ontwikkeld.

Dual pariteit

Een van de meest voorkomende wijzigingen van de bestaande RAID-niveaus is het "dual gelijk", ook wel "diagonaal pariteit". Zoals in RAID 6, hebben zij twee verschillende types van gelijkheid geschapen, maar in tegenstelling tot de tweede soort is niet alleen een extra kopie van de eerste. Daarentegen zijn de meeste implementaties dual-pariteit berekenen extra pariteit op een andere groep van blokken. Terwijl RAID 5 en RAID 6 pariteit traditioneel berekend op een groep van standaard blokken, dubbele pariteit maakt ook gebruik van verschillende groepen; bijvoorbeeld in de tekening hieronder, de RAID 5 en RAID 6 berekenen pariteit met alle blokken beginnen met A. Het systeem maakt gebruik van plaats ook dubbelklikken pariteitsblokken genummerd met 1 tot een pariteit ander afleiden.

RAID 7

De RAID-7 is een handelsmerk van Storage Computer Corporation. Het voegt een caching systeem om RAID-3 of RAID-4 om de prestaties te verhogen.

(0)
(0)
Commentaren - 0
Geen reacties

Voeg een Commentaar

smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile smile smile smile smile
smile smile smile smile
Tekens over: 3000
captcha