Deduplikácia údajov v systéme Windows Server 2012

Windows Server 2012 predstavuje novú funkciu údaje deduplikácie (Deduplikácia údajov). Čo je deduplikácia? Deduplikácia údajov vo všeobecnosti ide o postup na nájdenie a vymazanie duplicitných údajov na pamäťovom médiu bez narušenia integrity informácií. Účelom duplikácie je uložiť informácie do malých blokov (32 - 128 Kb), identifikovať ich (duplicitné bloky) a uložiť iba jednu kópiu pre každý blok a nahradiť duplicitné bloky odkazmi na jednu kópiu..

Predtým ste museli organizovať deduplikáciu pomocou produktov tretích strán (existujú riešenia hardvérovej deduplikácie na úrovni diskových polí a softvér na úrovni súborov). Náklady na takéto riešenia boli dosť vysoké, pretože sa zameriavajú predovšetkým na bohatých firemných zákazníkov. Táto funkcia je teraz úplne bezplatná pre všetkých používateľov systému Windows Server 2012.

Existuje malý hack, ktorý vám umožní povoliť deduplikáciu v klientskych operačných systémoch (Windows 8 a Windows 8.1). Podrobnosti v článku: Ako povoliť deduplikáciu údajov v systéme Windows 8.1

V systéme Windows Server 2012 je deduplikácia implementovaná ako dve zložky:

  • Ovládač filtra, ktorý riadi funkcie vstupu / výstupu
  • Deduplikačné služby - riadi tri operácie („odvoz odpadu“, „optimalizácia“ a „čistenie“).

Tieto komponenty sú zodpovedné za nájdenie zodpovedajúcich údajov, organizáciu ich uloženia v jednotnom čísle a za správny prístup k nim.

Deduplikácia v produktoch spoločnosti Microsoft bola predtým nájdená v poštovom serveri Exchange 200/2003/2007 - v komponente Single Instance Storage (iba jedna kópia správy je uložená na serveri v poštovej schránke jedného z príjemcov a ostatní príjemcovia dostanú iba odkaz na túto adresu).

Deduplikácia údajov v systéme Windows Server 2012 beží na pozadí a začína sa predvolene každú hodinu. Proces sa spustí, keď je zaťaženie servera nízke a neznižuje celkový výkon servera. V predvolenom nastavení sú súbory, ku ktorým sa nepristupovalo dlhšie ako 30 dní, deduplikované. Okrem toho sa postup nevykonáva pre tieto typy súborov: aac, AIF, aiff, asf, ASX, au, avi, flac, jpeg, m3u, stredná, midi, mov, MP1, mp2, mp3, mp4, mpa, mpe, mpeg, mpeg2, mpeg3, mpg, ogg, qt, qtw, baran, rm, RMI, RMVB, snd, swf, vob, wav, vosk, wma, wmv, wvx, accdb, accde, accdr, accdt, .docm, docx, dotm, dotx, .pptm, potme, potx, ppam, .ppsx, pptx, sldx, sldm, thmx, xlsx, xlsm, xltx, xltm, xlsb, xlam, XLL, eso, oblúk, arj, BHX, b2, kabína, gz, gzip, HPK, HQX, poháre, LHA, LZH, LZX, potom, jama, rar, mora, sit, SQZ, tgz, uu, Uue, z, zips, zoologická záhrada.

Funkcie správy deduplikácie sú dostupné z grafického používateľského rozhrania a prostredníctvom aplikácie PowerShell. Zvážte obidve možnosti.

Grafické rozhranie na deduplikáciu dát systému Windows Server 2012

Ak chcete povoliť deduplikáciu údajov, musíte nainštalovať komponent údaje Deduplicaion úlohy File and Storage Services. Môžete to urobiť z konzoly server Manahger.

Po inštalácii súčasti otvorte Správca servera -> Súborové a úložné služby -> Objemy -> konzola a kliknite pravým tlačidlom myši na časť, pre ktorú chcete povoliť deduplikáciu, a vyberte Konfigurácia deduplikácie údajov.

V ďalšom okne začiarknite políčko „Povoliť deduplikáciu údajov“. Tu môžete zadať adresáre, ktoré nemusia byť deduplikované a nastavenia plánovača deduplikácie.

V stĺpci sa zobrazí aktuálna úroveň deduplikácie. deduplikácie rýchlosť (aktualizované o niekoľko hodín).

Na analýzu využitia miesta na disku a možných úspor z umožnenia deduplikácie pre tento zväzok bol vyvinutý obslužný program DDPEVAL.exe. Pomocou nasledujúceho príkazu môžete odhadnúť, koľko miesta na disku môžete po zapnutí deduplikácie údajov ušetriť (nezabudnite, že pri veľkých zväzkoch môže spôsobiť značné zaťaženie CPU).

c: \ windows \ system32 \ ddpeval.exe e: \

V mojom prípade by úspory boli asi 57%.

Deduplikácia Powershell

Proces deduplikácie môže byť tiež riadený z Powershell. Ak to chcete urobiť, nainštalujte funkciu deduplikácie údajov pomocou príkazov:

Import-Module ServerManager
Add-WindowsFeature - názov FS-Data-Deduplication
Deduplikácia importného modulu

Po povolení funkcie deduplikácie sa musí nakonfigurovať. Ak chcete povoliť deduplikáciu jednotky D:, spustite príkaz:

Povoliť DedupVolume D:

V predvolenom nastavení sú súbory, ku ktorým nie je možné pristupovať (posledný prístup) dlhšie ako 30 dní, deduplikujú sa. Túto hodnotu je možné zmeniť, napríklad na 2 dni, spustiť príkaz:

Set-DedupVolume D: -MinimumFileAgeDays 2

Proces deduplikácie zvyčajne začína plánovač systému Windows, ale dá sa spustiť aj manuálne:

Start-DedupJob D: Optimalizácia typu

Aktuálne štatistiky si môžete prezerať pomocou príkazu:

Get-DedupStatus

Zoznam aktuálnych úloh nájdete pomocou príkazu:

Get-DedupJob

Všetky výsledky pre zväzok možno zobraziť príkazom PoSH:

Get-DedupMetadata -Volume D:

A nakoniec môžete deduplikáciu zväzku úplne zrušiť príkazom:

Start-DedupJob -Volume D: -Type Unoptimization

Nasledujúci obrázok ukazuje, že po povolení deduplikácie na jednotke E: (pre test som naň umiestnil 4 rovnaké ISO so systémom Windows 8), sa veľkosť využitého miesta na disku znížila z 12 GB na 3 GB.

Služba deduplikácie ukladá svoju databázu a deduplikované kúsky do adresára System Volume Information. Preto by ste v žiadnom prípade nemali zasahovať do jeho štruktúry manuálne.

Osvedčené postupy na použitie deduplikácie údajov v systéme Windows Server 2012

Spoločnosť Microsoft uverejnila nasledujúce výsledky štúdie o účinnosti duplikácie rôznych typov údajov.

Typy údajovMožné úspory miesta
Všeobecné údaje50-60%
dokumenty30-50%
Knižnica aplikácií70-80%
Knižnica VHD (X)80-95%

Kľúčové vlastnosti deduplikácie údajov v systéme Windows Server 2012:

  • Funguje iba na zväzkoch NTFS a nepodporuje súborový systém ReFS.
  • Nie je podporované pre bootovacie a systémové zväzky
  • Nepracuje s komprimovanými a šifrovanými súbormi NTFS
  • Podporuje ukladanie do pamäte cache a BITS
  • Nepodporuje súbory menšie ako 32 kB
  • Nie je nakonfigurované prostredníctvom skupinových pravidiel
  • Nepodporuje zdieľané zväzky klastra
  • Deduplikácia - proces nie je okamžitý a nejaký čas trvá