Komprese je proces, při kterém snižujeme objem dat. Cílem je úspora úložného prostoru nebo rychlejší přenos po síti.
Data po rozbalení (dekompresi) jsou identická s originálem. Neztratí se ani jeden bit.
Princip: Hledání opakujících se vzorců. Například místo zápisu „modrá, modrá, modrá, modrá“ zapíšeme „4x modrá“ (RLE – Run-Length Encoding).
Využití: Textové dokumenty, programy (EXE), zdrojové kódy, archivace (ZIP, RAR, 7z), bezeztrátový zvuk (FLAC) nebo obrázky s grafikou (PNG).
Výhoda: Naprostá přesnost.
Nevýhoda: Menší kompresní poměr (data se nezmenší tolik jako u ztrátové).
Při kompresi se část informací trvale zahodí. Algoritmy využívají nedokonalosti lidských smyslů (oka a ucha).
Princip: Odstraňují se detaily, které člověk nevnímá (např. velmi podobné odstíny barev nebo frekvence zvuku, které neslyšíme).
Využití: Fotografie (JPEG), video (MP4, MKV), hudba (MP3, AAC).
Výhoda: Obrovské zmenšení souboru (klidně 1:10 i více).
Nevýhoda: Nelze vrátit zpět. Při opakovaném ukládání kvalita viditelně klesá (vznikají tzv. artefakty).
Při přenosu dat (např. přes Wi-Fi nebo stahování z webu) může dojít k chybě – nula se změní na jedničku. Mechanizmy kontroly to musí odhalit.
Nejjednodušší metoda kontroly. K bloku dat se přidá jeden bit navíc tak, aby celkový počet jedniček byl sudý (sudá parita) nebo lichý (lichá parita).
Příklad: Máme 1101 (3 jedničky). U sudé parity přidáme jako 5. bit jedničku (celkem 4 jedničky).
Slabina: Odhalí jen změnu jednoho bitu. Pokud se změní dva bity naráz, chyba zůstane skrytá.
Složitější matematický výpočet. Data se sečtou (nebo proženou funkcí) a výsledek se pošle se zprávou. Příjemce provede stejný výpočet. Pokud se výsledky liší, data jsou poškozená.
Pokročilejší metoda používaná v síťových kartách a discích. Využívá dělení polynomů. Je velmi efektivní při odhalování shluků chyb.
Tato technologie chybu nejen najde, ale dokáže ji i opravit bez nutnosti znovu stahovat soubor.
Využívá se u operačních pamětí serverů (ECC RAM) nebo na poškrábaných CD/DVD (i když je část povrchu nečitelná, díky redundantním datům se zbytek dopočítá).
V souvislosti s kontrolou dat se často mluví o „haši“. Je to unikátní digitální otisk souboru.
Vlastnosti: I změna jediného písmene v celém filmu totálně změní výsledný hash.
Algoritmy: MD5 (starší), SHA-256 (moderní).
Využití: Když stahujete Linux nebo velký software, autor často uvádí hash. Po stažení si ho vypočítáte u sebe a pokud souhlasí, máte jistotu, že soubor je kompletní a nikdo do něj nevložil virus.