Praktyczne problemy w odzyskiwaniu danych z RAID

Sprzęt i przygotowanie

Zanim zaczniesz odzyskiwać macierz RAID w domu, musisz jasno zrozumieć, jakie są wymagania dotyczące sprzętu. Jeśli system, na którym planujesz odzyskać macierz RAID, nie spełnia podstawowych wymagań, musisz zaktualizować istniejący system lub odzyskać dane z macierzy przy użyciu innego komputera.
Powinieneś również z góry zdecydować, jaki efekt chcesz uzyskać. Może wystarczy, że odzyskasz parametry tablicy (a potem spróbujesz złożyć oryginalną tablicę) albo chcesz skopiować dane z tablicy plik po pliku na inny nośnik.
W zależności od potrzeb może być wymagana dodatkowa konfiguracja systemu, np. dołożenie dysków do kopiowania danych z macierzy.

Wymagania systemowe

Wymagania systemowe można podzielić na dwie grupy:

  • Program do odzyskiwania macierzy RAID narzuca wymagania dotyczące pamięci i mocy procesora (CPU).
  • Dyski Twojej macierzy narzucają wymagania dotyczące zasilania (PSU) oraz liczby portów SAS/SATA.

Wymagania Systemowe
Program do odzyskiwania pamięci i procesora RAID przetwarza duże ilości danych, wykonując różne obliczenia, które wymagają znacznych zasobów procesora. Dlatego lepiej jest wybrać mocniejszy komputer, aby odzyskać konfiguracje macierzy i zaoszczędzić czas.

Program do odzyskiwania macierzy RAID wykorzystuje podejście statystyczne do analizy danych. Oznacza to, że program do odzyskiwania RAID odczytuje dane z dysków składowych macierzy, a następnie przetwarza te dane przy użyciu specjalnych algorytmów, wymagających mocy procesora.

Dopóki program do odzyskiwania RAID nie zgromadzi wyników analizy wystarczających do podjęcia ostatecznej decyzji, przechowuje zgromadzone dane w pamięci komputera. Dlatego im więcej dostępnej pamięci, tym lepiej dla oprogramowania do odzyskiwania RAID. Mimo, że pewne wymagania zasobowe zależą od konkretnej tablicy, można powiedzieć, że:

  • laptop Intel Atom z pamięcią 512 MB – zbyt słaby system,
  • dwurdzeniowy procesor i pamięć od 8 do 16 GB – dobry wybór,
  • sześciordzeniowy procesor serwerowy i 128 GB pamięci – jest to spora przesada.

Ponowne uruchamianie
Z punktu widzenia odzyskiwania RAID ponowne uruchomienie jest niepożądane, ponieważ może zmienić ścieżki dysków. W przypadku ponownego przywracania danych z macierzy RAID na komputerze po ponownym uruchomieniu należy zachować ostrożność podczas wybierania dysków do analizy, ponieważ ich nazwy (ścieżki dysków) mogą nie odpowiadać poprzednim.

Należy zauważyć, że zmiany ścieżek dyskowych spowodowane restartem systemu są typowe dla dysków podłączonych przez USB.

Innym częstym przypadkiem, w którym ponowne uruchomienie psuje odzyskiwanie, jest sytuacja, w która występuje między odzyskaniem parametrów macierzy a wyodrębnieniem danych z macierzy przy użyciu tych parametrów.

W tym przypadku plik opisujący konfigurację macierzy nie jest już zgodny z prawdziwą konfiguracją, ponieważ kolejność dysków uległa zmianie z powodu ponownego uruchomienia. W takim przypadku należy ponownie uruchomić odzyskiwanie RAID, aby uzyskać aktualną konfigurację macierzy.

Ponowne uruchomienie systemu może być zarówno zaplanowane, jak i nie. Planowane ponowne uruchomienia obejmują przypadki, w których w jakiś sposób zmienisz konfigurację sprzętu komputerowego, na przykład dostosowując ją do wymagań sprzętowych odzyskiwania RAID.

Nieplanowane ponowne uruchamianie ma miejsce na przykład w przypadku ponownego uruchomienia systemu po regularnej aktualizacji systemu Windows. Dlatego zaleca się wyłączenie automatycznych aktualizacji systemu Windows.

Wymagania sprzętowe

Zasilacz (PSU)
W przypadku sprzętowej a czasami również i programowej macierzy RAID w celu odzyskania konfiguracji macierzy, należy wyjąć dyski z urządzenia stworzonego do RAID. Po wyjęciu dysków z serwera NAS lub odłączeniu ich od kontrolera RAID należy podłączyć je do komputera, na którym planujesz odzyskać konfigurację macierzy.

W tym momencie powinieneś mieć świadomość, że jeśli wniesiesz nowe dyski do starego systemu, moc istniejącego zasilacza może być niewystarczająca. Czasami wiesz o tym od razu, ponieważ system po prostu nie działałby. Istnieje jednak stan pośredni, w którym nie ma widocznych komunikatów o błędach, ale dyski nie działają prawidłowo, co powoduje znaczne zmniejszenie szybkości analizy.

Jak dyski członkowskie są podłączone do komputera?
Wybierając sposób podłączenia dysków do komputera, na którym zamierzasz przeprowadzić odzyskiwanie, musisz zdać sobie sprawę, jakiej wydajności możesz oczekiwać w każdym przypadku.

USB i SATA (bezpośrednie połączenie z płytą główną)
Aby uzyskać maksymalną wydajność odzyskiwania RAID, zaleca się podłączenie dysków bezpośrednio do portów płyty głównej. Jednak często nie jest możliwe skonfigurowanie systemu zgodnie z zaleceniami (np. za mało portów), więc dyski są podłączane przez USB.
Rzućmy okiem na średnią prędkość odczytu, jaką uzyskujesz przy użyciu różnych sposobów połączenia.

Szacowanie prędkości
Prędkość odczytu dysku obejmuje:

  • szybkość, z jaką sam dysk zwraca dane,
  • szybkość przesyłania danych.

Średnia prędkość odczytu zwykłego dysku twardego wynosi około 60 MB/s. Szybkość przesyłania danych do programu do odzyskiwania danych z macierzy RAID zależy od typu połączenia. Przepustowość połączenia SATA jest większa niż średnia prędkość odczytu dysku.

Nie zawsze dotyczy to protokołów USB. Istnieje kilka protokołów USB, z których każdy ma własną prędkość transferu.

  • USB 1.1 – najwolniejszy protokół ze średnią prędkością około 1,5 MB/s, co jest absolutnie niedopuszczalne w przypadku odzyskiwania RAID.
  • USB 2.0 – najpopularniejszy protokół USB, który zapewnia prędkość transferu około 10-15 MB/s. Jest to minimalna dopuszczalna prędkość odzyskiwania.
  • USB 3.0. Chociaż przepustowość protokołu wynosi do 600 MB/s, ogólna prędkość odczytu będzie taka sama jak w przypadku połączenia SATA, a konkretnie około 60 MB/s, ponieważ będzie ograniczona przez prędkość odczytu dysku.

Posiadanie USB 3.0 jest świetne, jeśli udało ci się go uruchomić. W rzeczywistych konfiguracjach z wieloma dyskami, a zwłaszcza koncentratorami, często wraca się do USB 2.0.

Jeśli korzystasz z połączenia SATA, odzyskasz konfigurację macierzy pięć razy szybciej, w ciągu kilku dni.

Obsługa uszkodzonych sektorów pojawiających się w trakcie odczytu dysku lub dysków w macierzy.
Powinieneś wiedzieć, że implementacje konwerterów SATA-USB radzą sobie z uszkodzonymi sektorami gorzej niż zwykły port SATA. Czasami prowadzi to do zawieszenia oprogramowania do odzyskiwania danych podczas próby odczytania danych ze złego sektora.

Nie masz takiego problemu z dyskami podłączonymi do portów płyty głównej, ponieważ w przypadku napotkania uszkodzonego sektora dyski nadal są w stanie zwrócić kontrolę do programu bez powodowania jego zawieszenia.

Pliki obrazów dysków
Umieszczając pliki obrazów dysków na dyskach fizycznych, spróbuj umieścić jeden plik obrazu dysku na dysk fizyczny. Dzięki temu uzyskasz maksymalną możliwą prędkość odczytu.

Jeśli umieścisz kilka plików obrazów dysku na jednym fizycznym dysku, znacznie stracisz prędkość odczytu ze względu na czas wyszukiwania. Prędkość odczytu w przypadku umieszczenia „jeden plik obrazu dysku na dysk fizyczny” jest dziesięciokrotnie większa niż w przypadku, gdy na jednym dysku fizycznym znajdują się dwa pliki obrazu dysku.

Przypadki mieszane
Jeśli podłączysz dyski na kilka sposobów, na przykład podłączysz niektóre dyski przez USB, a inne przez SATA, prędkość odczytu będzie określana przez najwolniejszy dysk.

  • Tylko SATA – około 40-50 MB/s,
  • mieszane SATA i USB daje jakieś 15-20 MB/sek,
  • Tylko USB – spodziewaj się około 7-10 MB/s.

Uwaga: Wszystkie powyższe dotyczą USB 2.0.

Wyjście dla odzyskiwania danych z RAID
Zanim zaczniesz odzyskiwać konfigurację macierzy, powinieneś wcześniej zdecydować, co chcesz zrobić z odzyskanymi parametrami. Jeśli zamierzasz zapisać kopię tablicy na dysku, a następnie spróbujesz uzyskać dostęp do danych za pomocą Linuksa, potrzebujesz pamięci o takim samym rozmiarze, jak użyteczna pojemność Twojej macierzy.

Jeśli jednak planujesz odzyskać pliki, potrzebujesz przestrzeni dyskowej o tym samym rozmiarze, co szacowany rozmiar plików, które chcesz odzyskać. Jeśli chcesz tylko uzyskać opis konfiguracji macierzy i kontynuować proces odzyskiwania później, pamiętaj, że jeśli do czasu podjęcia decyzji o odzyskaniu danych z macierzy system został ponownie uruchomiony, opis macierzy może być niepoprawny.

Wskazówki dotyczące wykrywania typu tablicy
W naszej praktyce jednym z najczęstszych błędów jest określenie niewłaściwego typu tablicy. Istnieje kilka prostych sposobów na sprawdzenie, jaki może być typ macierzy, a jaki na pewno nie może znajdować się na dyskach.

Wskazówki dotyczące wykrywania typu tablicy
W naszej praktyce jednym z najczęstszych błędów jest określenie niewłaściwego typu tablicy. Istnieje kilka prostych sposobów na sprawdzenie, jaki może być typ macierzy, a jakiego na pewno nie może znajdować się na dyskach.

Korzystanie z zarządzania dyskami
Zarządzanie dyskami wyświetla dyski z partycjami lub bez, gdy całe miejsce na dysku jest oznaczone jako nieprzydzielone. Rozmiary partycji na dyskach członkowskich tablicy mogą być większe niż rozmiary dysków fizycznych (z wyjątkiem RAID 1), ponieważ rozmiary partycji odpowiadają oryginalnej pojemności tablicy.

Zazwyczaj tylko jeden dysk z zestawu będzie miał partycje. Możesz jednak zauważyć, że dwa dyski zawierają partycje w przypadku lustrzanych macierzy RAID (RAID 1 lub RAID 10) lub gdy parzystość RAID 5 jest obliczana jako dokładna kopia tabeli partycji. Czasami możesz zobaczyć wszystkie dyski bez partycji i wtedy nie jesteś w stanie określić typu tablicy.

Oznacza to, że tablica partycji nie jest we właściwym miejscu. Taka sytuacja może mieć miejsce, gdy kontroler umieści własne metadane przed tablicą partycji, powodując przemieszczenie tablicy partycji.

Z drugiej strony zdarza się również, że wszystkie dyski są wyświetlane z partycjami, ale Windows nie pokazuje dla nich typu systemu plików. Oznacza to, że masz do czynienia z oprogramowaniem RAID dla systemu Linux (md-raid).

RAID 0
W Zarządzaniu dyskami powinien być widoczny tylko jeden dysk z partycjami, podczas gdy wszystkie pozostałe dyski powinny być oznaczone jako nieprzydzielone.

RAID 5 i RAID 10
W Zarządzaniu dyskami będzie jeden lub dwa dyski z partycjami, w zależności od tego, jakie dane znajdowały się na dyskach i czy brakuje dysku.

RAID 1
W przypadku RAID 1 powinieneś widzieć tylko dwa dyski i oba z identycznymi zestawami partycji w Zarządzaniu dyskami. Najprawdopodobniej nie potrzebujesz żadnego odzyskiwania danych.

Praktyczne problemy w odzyskiwaniu danych z RAID.

Sprawdzanie typu macierzy w Zarządzaniu dyskami
Co więc zrobić, aby sprawdzić, czy Twój pomysł na typ macierzy jest zgodny z danymi, które zapewnia Zarządzanie dyskami.

1. Jeśli masz wszystkie dyski członkowskie (nie ma brakujących dysków) i wyświetla się Zarządzanie dyskami

  • jeden dysk z partycjami, a drugi jako nieprzydzielony, masz do czynienia z RAID 5 lub RAID 0.
  • dwa dyski z partycjami i pozostałe jako nieprzydzielone, masz RAID 5 lub RAID 10.

2. Jeśli brakuje jednego dysku członkowskiego,

  • RAID 0 nie jest brany pod uwagę, ponieważ nie jest macierzą odporną na uszkodzenia i dlatego nie może przetrwać awarii jednego dysku członkowskiego.
  • nie można odróżnić RAID 5 od RAID 10.

3. Jeśli wszystkie dyski należące do macierzy są pokazane z partycjami, najprawdopodobniej masz do czynienia z Linux md-raid i dlatego nie potrzebujesz odzyskiwania danych z RAID.

Korzystanie z danych md-raid w przypadku urządzenia NAS
Jeśli zestaw dysków pochodzi z urządzenia NAS, możesz spróbować uzyskać dostęp do danych bez odzyskiwania RAID. Po prostu pobierz ReclaiMe File Recovery i uruchom go, mając wszystkie dyski członkowskie podłączone oddzielnie do komputera. Jeśli masz szczęście i dane md-raid nie są zbytnio uszkodzone, program montuje macierz i zapewnia dostęp do macierzy
dane.

Zestaw dysków do analizy
Często uważa się, że im więcej dysków z macierzy zostanie użytych do odzyskiwania RAID, tym lepiej. W praktyce nie zawsze tak jest. Na przykład, jeśli dysk zapasowy jest dołączony do zestawu dysków macierzy RAID 5, oprogramowanie do odzyskiwania RAID nie jest w stanie rozwiązać problemu.

Z pewnością, aby odzyskać macierz RAID 0, powinieneś mieć wszystkie dyski; w przeciwnym razie nie można odzyskać danych z macierzy RAID 0. W przypadku macierzy odpornych na awarie masz pewną swobodę wyboru, aby nie uwzględniać jednego z dysków w analizie.

Hot spare w macierzy RAID 5
Analizując macierz RAID 5, zawsze należy wykluczyć (hotspare) dysk zapasowy, jeśli taki istnieje. Jeśli nie wiesz na pewno, czy jest  dysk zapasowy, najpierw spróbuj dołączyć wszystkie dyski. Jeśli nie możesz znaleźć rozwiązania, spróbuj zidentyfikować dysk zapasowy, na przykład poszukaj dysku nieco innego od pozostałych lub po prostu wyklucz dyski jeden po drugim.

Jeśli wszystkie dyski członkowskie są obecne, ale ReclaiMe Free RAID Recovery wyświetla komunikat ostrzegawczy „Stwierdzono, że w zestawie RAID 5 brakuje dysku”, wykluczaj dyski jeden po drugim, aż znajdziesz zestaw dysków, dla którego ten komunikat nie jest pokazany.

Jeśli brakuje jednego dysku członkowskiego, sztuczka nie działa i musisz wykonać odzyskiwanie RAID tyle razy, ile jest dysków członkowskich.

RAID 5 ze wszystkimi dostępnymi dyskami nie może być odzyskany
Jeśli masz RAID 5 ze wszystkimi dostępnymi dyskami, ale nie możesz odzyskać jego konfiguracji, spróbuj wykluczyć jeden z dysków. Jeśli na jednym z dysków znajdują się dane niezgodne z danymi na innych dyskach, trudno będzie uzyskać prawidłowe rozwiązanie.

Możesz spotkać się z taką sytuacją, na przykład jeśli wymieniłeś uszkodzony dysk na hot-spare, ale odbudowa nie została zakończona. Ponieważ ReclaiMe Free RAID Recovery może obsłużyć RAID 5 z brakującym jednym dyskiem, lepiej jest po prostu wykluczyć taki podejrzany dysk z analizy. Najpierw zwróć uwagę na dysk, który:

  • został niedawno wymieniony,
  • został automatycznie zastąpiony gorącym zapasem,
  • różni się w jakiś sposób od innych, na przykład rozmiarem, dostawcą lub modelem.

Wyklucz uszkodzony dysk z macierzy odpornej na uszkodzenia
Czasami ReclaiMe Free RAID Recovery działa zbyt wolno, więc po prostu nie możesz czekać na rozwiązanie. Często oznacza to, że jeden z dysków jest fizycznie uszkodzony. Jeśli masz macierz odporną na uszkodzenia ze wszystkimi dostępnymi dyskami, możesz spróbować wykluczyć ten wadliwie działający dysk i ponownie przeprowadzić odzyskiwanie. Jeśli nie możesz wykryć, który dysk ma problem, wykluczaj dyski jeden po drugim i zobacz, co to przynosi.

Oczekiwany czas analizy
Oczekiwany czas analizy zależy od tego, jakie dane i ile danych było przechowywanych w macierzy.

 Mniej wypełnione tablice są odzyskiwane wolniej niż bardziej wypełnione.
 Jeśli w macierzy jest dużo małych plików, spodziewaj się szybszego odzyskiwania. Jeśli w macierzy RAID przechowywanych jest tylko kilka dużych plików, odzyskiwanie zajmie więcej czasu.
 Jeśli w macierzy znajduje się dużo danych o wysokiej entropii, takich jak filmy, muzyka lub skompresowane pliki, możesz liczyć na to, że odzyskiwanie będzie wolniejsze. W przeciwnym razie, przy danych o niskiej entropii, takich jak tekst lub pliki bazy danych, uzyskasz wynik szybciej.

W zależności od danych przechowywanych w macierzy czas analizy może ulec skróceniu. Czasami może się zdarzyć, że rozwiązanie zostanie osiągnięte wcześniej niż odczytana zostanie cała pojemność tablicy. W najgorszym przypadku konieczne jest odczytanie wszystkich danych ze wszystkich dysków i tutaj czas analizy zależy od prędkości odczytu dysku, której oszacowanie podano w akapicie „oszacowanie prędkości”.

Należy zauważyć, że czas analizy może się różnić na tym samym zestawie dysków ze względu na specyfikę algorytmu ReclaiMe Free RAID Recovery. Program odczytuje dane losowo, tworząc nową sekwencję przy każdym uruchomieniu.