Osvědčené postupy při deduplikaci

Deduplikace je složitý proces, který závisí na mnoha faktorech.

Nejdůležitější faktory, které ovlivňují rychlost deduplikace, jsou:

  • rychlost přístupu k deduplikační databázi,
  • kapacita paměti RAM v uzlu úložišť,
  • Počet deduplikačních umístění vytvořených v uzlu úložišť.

Chcete-li zvýšit výkone deduplikace, dbejte následujících doporučení.

Umístěte deduplikační databázi a deduplikační umístění na samostatná fyzická zařízení.

Deduplikační databáze ukládá hodnoty hash všech položek uložených v umístění – kromě těch, které nelze deduplikovat, jako jsou šifrované soubory.

Chcete-li zvýšit rychlost přístupu k deduplikační databázi, musí se databázi a umístění nacházet na samostatných fyzických zařízeních.

Nejvhodnější je přidělit vyhrazená zařízení pro umístění a databázi. Pokud to není možné, neumisťujte aspoň umístění nebo databázi na jeden disk s operačním systémem. A to z důvodu, že operační systém provádí velké množství operací pro zápis/čtení z disku, které podstatně zpomalují deduplikaci.

Výběr disku pro deduplikační databázi

  • Databáze se musí nacházet na pevném disku. Neumisťujte deduplikační databázi na externí jednotky.
  • Pokud chcete co nejvíce zkrátit přístupové časy k databázi, uložte ji místo připojeného síťového svazku přímo na připojený disk. Výkon deduplikace může výrazně snížit latence sítě.
  • Požadovaný diskový prostor pro deduplikační databázi lze odhadnout pomocí následujícího vzorce:

V = U * 90 / 65536 + 10

Kde,

V je velikost disku v GB,

U je plánované množství jedinečných dat v deduplikačním úložišti dat v GB,

Pokud je například plánované množství jedinečných dat v deduplikačním úložišti dat U=5 TB, bude deduplikační databáze požadovat minimum volného prostoru, jak je ukázáno níže:

V = 5000 * 90 / 65536 +10 = 17 GB

Výběr disku pro deduplikační umístění

Aby se předešlo ztrátě dat, doporučujeme používat RAID 10, 5 nebo 6. RAID 0 se nedoporučuje, protože není odolný vůči chybám. RAID 1 není doporučován, kvůli relativně nízké rychlosti. Řešení pomocí místních disků nebo SAN je rovnocenné, obě řešení jsou dobrá.

40 až 160 MB paměti RAM na 1 TB jedinečných dat

Po dosažení limitu se deduplikace zastaví, ale zálohování a obnovení budou i nadále fungovat. Pokud do uzlu úložišť přidáte více paměti RAM, bude po dalším zálohování deduplikace pokračovat. Obecně platí, že čím více máte paměti RAM, tím větší objem jedinečných dat můžete ukládat.

Pouze jedno deduplikační umístění ke každému uzlu úložišť

Doporučuje se vytvořit pouze jedno deduplikační umístění v uzlu úložišť. V opačném případě může být celý dostupný svazek paměti RAM rozdělen podle velikosti mezi více umístění.

Nepřítomnost aplikací soupeřících o prostředky

V počítači s uzlem úložiště by neměly běžet aplikace, které požadují mnoho systémových prostředků, například systém řízení báze dat (SŘBD) nebo systém ERP (Enterprise Resource Planning).

Procesor s více jádry a frekvencí procesoru alespoň 2,5 GHz

Doporučujeme použít procesor s nejméně čtyřmi jádry a taktem CPU minimálně 2,5 GHz.

Dostatek volného prostoru v umístění

Deduplikace u cíle vyžaduje tolik volného místa, kolik zabírají zálohovaná data ihned po uložení do umístění. Bez komprese nebo deduplikace ve zdroji je tato hodnota rovna velikosti původních dat zálohovaných během dané operace zálohování.

Vysokorychlostní LAN

Doporučuje se 1GB síť LAN. Ta povolí aplikaci provést 5 až 6 záloh zároveň s deduplikací a rychlost se výrazně nesníží.

Zálohujte obvyklý počítač před zálohováním více počítačů s podobným obsahem

Při zálohování více počítačů s podobným obsahem se doporučuje zálohovat nejdříve jeden z počítačů a počkat, dokud neskončí indexování zálohovaných dat. Poté budou ostatní počítače zálohovány rychleji díky efektivní deduplikaci. Většina dat je již v deduplikačním úložišti dat, protože záloha prvního počítače byla indexována.

Záloha různých počítačů v různém čase

Pokud zálohujete velký počet počítačů, rozložte operace zálohování v čase. K tomu je potřeba vytvořit více plánů zálohování s různým plánováním.