Množství informace

Budeme se věnovat ukládání a přenosu dat. Různé případy, jak se s daty můžeme setkat – soubor na disku, paket na síti, SMS, popsaný lístek papíru – budeme označovat jednoduše jako zpráva, protože nám na fyzické podobě nezáleží. Důležitý není ani samotný obsah. Chceme si udělat jasno ve způsobu, jak může být zpráva zapsaná.

Obecný pohled

Množství informace prostě odpovídá počtu možností, jak může zpráva vypadat. Například máme 1000 možností, jak může vypadat tříciferné číslo.

Každý znak, který ke zprávě připíšeme, násobí počet možností. Pokud všechny znaky jsou ze stejné abecedy, můžeme možnosti spočítat umocňováním. Když například v roli abecedy budeme mít číslice 0—9, počet možností je 10n, kde n je délka zprávy.

Když známe počet možností a chceme určit, kolik číslic je k tomu potřeba, použijeme metodu pokus-omyl. Budeme postupně zprávu prodlužovat a zkoušet, kdy má aspoň tolik možností, co potřebujeme. Šikovnější a rychlejší by bylo použít logaritmus – pokud víte jak, nebojte se.

Bity a bajty

Jednotka pro množství informace je bit – číslice 1 nebo 0. Zkratka je malé b. Zpráva dlouhá n bitů nese 2n možností a říkáme, že je zapsaná binárně. Moderní počítače používají binární zápis skoro na všechno.

Osm bitů je bajt, puntičkáři také označovaný jako oktet. Zkratka je velké písmeno B. Protože osm bitů a jeden bajt je přesně stejné množství informace, při převodu mezi těmito zápisy se délka zprávy prostě násobí nebo dělí osmi.

Často se taky potkáváme se šestnáctkovou čili hexadecimální soustavou. Šestnáctková číslice nese 4 b informace, protože 24 = 16. Můžeme si snadno dopočítat, že v hexadecimálním zápisu má zpráva dvojnásobný počet číslic, než kolik měla původně bajtů.

Pro lidsky viditelný zápis strojových údajů se někdy používá taky base-64, soustava založená na 64 různých znacích. Jde o velká a malá písmena anglické abecedy, číslice a dva znaky navíc, většinou lomítko a minus. Šedesátčtyřkový znak má 6 b informace, protože 26 = 64.