Dlaczego RAID 6 przestanie działać w 2019 roku.

Oczywiście, żaden dostawca pamięci masowej nie zaleca RAID 5. Obecnie jest to RAID 6, który chroni przed awariami 2 dysków. Ale w 2019 nawet RAID 6 nie zechce chronić Twoich danych. Oto dlaczego.

Dobra wiadomość: Twórca systemu ZFS Adam Leventhal stwierdził, że poziomy ochrony RAID 6 będą tak dobre jak RAID 5 do roku 2019.

Zła wiadomość: Pan Leventhal przyjął, że dyski są bardziej wiarygodne niż są w rzeczywistości. Czas życia może być krótszy niż mówi o tym producent.

Problem z poziomem RAID polega na tym, że poziom RAID wzrasta, a więc utrata 1 lub 2 dysków. nie 0, 1 lub 10). Dodatkowe bity – parzystość – odtwarzają utracone dane, które mają zostać zrekonstruowane przez odczytanie wszystkich danych.

Kluczem problemów macierzy RAID są grupy dysków o specjalnej logice w sterowniku, które przechowują dane z dodatkowymi bitami, dzięki czemu utrata 1 lub 2 dysków nie niszczy informacji (mówimy tu tylko o poziomie raid 5 i 6). Dodatkowe bity – parzystość – umożliwiają odtworzenie utraconych danych poprzez odczytywanie wszystkich danych z pozostałych dysków i zapisanie na dysku zastępczym.

Problem z RAID 5 polega na tym, że dyski mają błędy odczytu. Napędy SATA są powszechnie określane z błędem odczytu błędów (URE) wynoszącym 10 ^ 14. Co oznacza, że raz na 200 000 000 sektorów dysk nie będzie mógł odczytać sektora.

200 milionów sektorów wynosi około 12 terabajtów. Jeśli się uszkodzi w napędzie 7, dysku SATA 2 TB na dysku RAID 5, będziesz mieć 6 pozostałych dysków o pojemności 2 TB. Ponieważ kontroler RAID dokonuje rekonstrukcji danych, jest bardzo prawdopodobne, że zobaczysz URE (Unrecoverable Read Errors). W tej chwili odtwarzanie RAID przestaje działać.

Oto matematyka: (1 – 1 / (2,4 x 10 ^ 10)) ^ (2,3 x 10 ^ 10) = 0,3835

Jest 62% szans na utratę danych ze względu na niewłaściwy błąd odczytu na 7-dyskowej macierzy RAID z jednym uszkodzonym dyskiem, przy założeniu błędu odczytu 10 ^ 14 i ~ 23 miliardów sektorów w 12 TB.

RAID 6 rozwiązuje ten problem, tworząc wystarczające dane o parzystości, aby obsłużyć 2 błędy. Można utracić dysk i mieć URE i nadal rekonstruować dane.

Niektórzy skarżą się na zwiększone obciążenie 2 dyskami parzystości. Podwojenie rozmiaru paska RAID 5 zapewnia jednakową ochronę dysku. Zamiast macierzy z 7 dyskami RAID 5 z 1 dyskiem parzystości, należy utworzyć 14 pasków z 2 dyskami parzystości: brak większej pojemności na parzystość i ochrony przed awarią 2 dysków.

Leventhal wskazuje na to, że zbieżność czynników prowadzi do czasu, w którym nawet podwójna parzystość nie wystarczy do ochrony danych przedsiębiorstwa.

Rozważania:

  • Długi czas odbudowy. W miarę zwiększania pojemności dysku, np. dysk 7200 obr./min w napędzie pełnym zapisuje średnio około 115 MB/s – spowalnia się w miarę napełniania – co oznacza około 5 godzin minimum w celu odbudowania uszkodzonego dysku. Ale większość tablic nie może sobie na to pozwolić by przebudowywać na najwyższej prędkości, więc odbudowa trwa zwykle 2-5x dłużej.
  • Więcej ukrytych błędów. Macierze korporacyjne wykorzystują przeszukiwanie dysku w tle, aby znaleźć i naprawić błędy dysku, zanim będą przebudowywać. Jednak w miarę zwiększania liczby uszkodzeń dysku, przebudowa trwa dłużej. W dużej macierzy dyskowej może trwać to kilka miesięcy zanim przebuduje wszystkie dyski, oznacza to więcej błędów w odbudowie.
  • Korelacja awarii dysku. Twórcy RAID zakładali, że awarie dysku są niezależnymi zdarzeniami, ale długie doświadczenie pokazało, że tak się nie dzieje: awaria dysku 1 oznacza, że druga jest znacznie bardziej prawdopodobna.

Uproszczenie: większe dyski = dłuższe odbudowy + dodatkowe ukryte błędy -> większe prawdopodobieństwo awarii RAID 6.

Pan Leventhal przedstawia wynik:

wykres Raid 5 vs raid 6

Do roku 2019 RAID 6 nie będzie już bardziej niezawodny niż RAID 5.

Bity pamięci masowej zajmują. Dla użytkowników korporacyjnych ten wniosek jest wielkim czynnikiem. Podczas gdy potrójna parzystość rozwiązuje problem ochrony, istnieją znaczące kompromisy.

21 pasków? Tygodniowa przebudowa oznacza, że tablice działają zawsze w zdegradowanym trybie odbudowy? Czy sprzedaż hurtowa przeniesiona będzie do napędów 2,5 cala? Funkcjonalna przestarzałość miliardów dolarów obecnych tablic?

Użytkownicy domowi mogą się zrelaksować. Domowa macierz RAID to zły pomysł: dużo częściej używamy robienia częstych kopii zapasowych na dysku lub kopii zapasowej online.

To, co jest szokujące to , że pan Leventhal przyznaje, że współczynnik błędów dysku wynosi 1 na 10 ^ 16. Dotyczy to małych, szybkich i kosztownych napędów korporacyjnych, ale większość napędów SATA ma 2 rzędy wielkości mniejszą: 1 na 10 ^ 14.

Jedyny wyjątek stanowi Caviar Green firmy Western Digital, model WD20EADS, jest określany na 10 ^ 15, w przeciwieństwie do 2 TB firmy Seagate w wersji ST32000542AS lub Deskstar 7K2000 firmy Hitachi.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *