(Toto je třetí ze čtyř částí příspěvku, který představuje 10 GB/s v perspektivě. V první části jsme popsali, co by hypotetický filmový robot mohl zvládnout s 10GB/s SSD. Druhá část definovala standardní měrné jednotky – bity a bajty – používané v počítačových technologiích. V této části se pokusíme vysvětlit obzvláště matoucí problém s úložišti a daty: dvě běžně používané definice pro stejné předpony jednotek)

Koupili jste si někdy počítačový systém například s 500GB úložným zařízením, ale při prvním spuštění vám operační systém hlásil pouze 465 GB? V části 2 jsme viděli, že giga- má znamenat miliardu, takže 500GB disk by měl mít kapacitu 500 miliard bajtů – nikoli 465 miliard. Je to tak?“

Je to tak!“

A taky to není správně.

Pokud jste se náhodou do této nesrovnalosti pustili, pravděpodobně jste zjistili, že těch chybějících 35 GB vůbec nechybí. Jde jen o to, že giga- se nepoužívá vždy přesně tak, jak si myslíte, že by mělo. Stejně jako mnoho pekařů považuje slovo tucet za 13, v některých kruzích se giga- používá ve významu 1 073 741 824! Pro mnohé z nás, kteří jsme vyrostli s tím, že miliarda je jednička a za ní následuje devět nul, může tato „jiná“ definice potřebovat vysvětlení.

A Trip Down Memory Lane

Počítače používají informace a instrukce obsažené v datových souborech. Tyto datové soubory se v moderním počítačovém systému nacházejí na dvou místech: v primární paměti a v sekundární paměti. Primární paměť, dnes nejčastěji paměť RAM (random access memory), obsahuje data, ke kterým mají procesory počítače okamžitý přístup. Sekundární paměť představuje především dlouhodobější úložiště, jako jsou pevné disky (HDD) a SSD (solid state drive). Data, která se nacházejí v sekundárním úložišti, musí být nejprve přesunuta do paměti RAM, aby je počítač mohl používat. Situace se podobá kancelářskému stolu a kartotéce:

Velikost souboru, ať už se nachází kdekoli, se obvykle vyjadřuje v bajtech. A jak bylo zmíněno ve 2. části tohoto příspěvku, protože se tyto velikosti obvykle pohybují v tisících, milionech nebo dokonce miliardách bajtů, jsou tyto velikosti zřídkakdy uváděny bez speciálních předpon. Problém vzniká proto, že výrobci sekundárních úložných zařízení historicky používali tradiční sadu definic předpon pro měření úložné kapacity svých disků, zatímco výrobci operační paměti a procesorových čipů se rozhodli používat jinou sadu definic pro tytéž předpony!“

Příběh dvou systémů

Většina počítačového a elektronického průmyslu používá metrický neboli desítkový systém předpon. Jeho současná podoba byla původně normalizována Mezinárodní soustavou jednotek (SI) v roce 1960. Metrická soustava předpon má za základ číslo 10, takže její předpony odpovídají číslům, která jsou celočíselnými mocninami 10. Například kilo- je 103 – což znamená 10 vynásobené třikrát sebou samým – neboli 1 000. Následné předpony v systému lze snadno vyjádřit jako mocniny tohoto čísla 1 000. Například předpona mega- je 1 0002 (1 000 000) a giga- je 1 0003 (1 000 000 000). V odvětví úložišť se metrický systém předpon používá k popisu kapacity sekundárních úložných zařízení.

Dvojkový systém předpon přichází v úvahu, když se mluví o primární paměti. Binární systém prefixů má za základ číslo 2, takže jeho prefixy odpovídají číslům, která jsou celočíselnými mocninami čísla 2. Když se data dostanou do primární paměti, je každé informaci přiřazena jedinečná adresa, která procesoru umožňuje data v případě potřeby najít. V polovině 60. let 20. století se binární adresovací schéma stalo v počítačových architekturách standardem, protože binární systém umožňuje nejefektivněji uspořádat binární data v paměti tak, aby všechna měla platné adresy.

Zpočátku se kapacita hlavní paměti vyjadřovala absolutními čísly, ale když první počítačoví odborníci zjistili, že je třeba vyjádřit větší kapacitu paměti, zjistili také potřebu používat k jejímu popisu předpony. Paměťový průmysl si již dříve osvojil používání metrického systému předpon založeného na soustavě SI. Kvůli pohodlí se tito odborníci rozhodli přijmout systém předpon také… s určitými úpravami. Všimli si, že číslo 1 024 neboli 210 (dvojková soustava) se přibližně rovná 1 000 neboli 103 (desítková soustava), a tak začali používat předponu kilo nikoli pro označení 1 000, ale pro označení 1 024! Následné předpony v systému lze vyjádřit jako mocniny tohoto čísla 1 024. Například z mega- se stalo 1,0242 a z giga- 1,0243.

Následující tabulka rozšiřuje tabulku uvedenou ve 2. části tohoto příspěvku a obsahuje nejen význam jednotlivých předpon, ale také přesnou hodnotu předpon obou systémů.

metrické předpony
Je však třeba si uvědomit, že celková kapacita našeho hypotetického SSD je stále 500 000 000 000 bajtů. Jde jen o to, že když toto číslo vydělíte gigabajtem, můžete získat dvě různé hodnoty, protože existují dvě různé definice gigabajtu. Když definujete gigabajt jako 1 0003 (nebo 1 000 000 000) bajtů, jak to dělá Mezinárodní soustava jednotek a jak to dělají výrobci úložišť, pak 500 000 000 000 bajtů je totéž jako 500 GB. Když definujete gigabajt jako 1 0243 (nebo 1 073 741 824) bajtů, jak to dělají výrobci operační paměti a některé hlavní operační systémy, pak 500 000 000 000 bajtů je totéž jako 465 GB.V počátcích to nebyl problém – rozdíl v aproximaci byl zanedbatelný. Koneckonců rozdíl mezi metrickým a binárním kilobajtem je pouze 2,4 %. Navíc každý, kdo někdy mluvil o KB, už věděl, zda se jedná o 1 000 bajtů paměti nebo 1 024 bajtů paměti. Postupem času se však kapacity paměti i úložiště začaly zvyšovat. S rostoucí kapacitou se relativní rozdíly mezi desítkovou a dvojkovou hodnotou téhož prefixu stávají výraznějšími. Například ačkoli rozdíl mezi binárním a metrickým kilo- může být pouze 2,4 %, rozdíl mezi giga- v obou interpretacích vzroste na 7,4 % a na 12,6 %, pokud hovoříme o peta-!

Vzhledem k potenciálním problémům s tímto rozdílem začalo koncem 90. let 20. století ve vědeckých kruzích hnutí za formální zavedení nové, odlišné konvence pojmenování předpon velkých binárních čísel. Výsledné binární prefixy byly v roce 1998 přijaty normalizačními orgány Mezinárodní elektrotechnickou komisí (IEC), Mezinárodní organizací pro normalizaci (ISO) a Národním institutem pro normy a technologie (NIST) a nyní se označují jako „prefixy IEC“. Předpony v tomto systému mají zajistit zřejmé rozlišení mezi oběma systémy a jsou tvořeny jako zkratky kombinující první dvě písmena předpon SI s písmeny bi (zkratka pro binární). Následující tabulka uvádí seznam předpon a jejich význam.

binární předpony

Přestože důsledky chybného použití jedné předpony, když se má použít druhá, nemusí být tak dramatické jako nesoulad, který vedl k nechvalně známému shoření sondy NASA Mars Climate Orbiter v roce 1999, kdy její software počítal sílu jejích trysek v „librách“, ale samostatný software přijal data v domnění, že jsou v metrické jednotce „newtonech“, může vás pochopení rozdílu mezi těmito systémy uchránit před překvapením – nebo alespoň před zmatkem.Bohužel ještě ne všichni výrobci počítačů, softwaru a pamětí začali používat standardizované vědecké definice, takže se stále pravděpodobně setkáte se stejnou předponou používanou pro metrickou i binární interpretaci. Ke zmatení spotřebitelů může stále docházet, když jimi nainstalované paměťové zařízení uvádí jednu kapacitu pomocí standardních předpon, ale jejich operační systém, který může vyjadřovat kapacitu primární paměti a sekundární paměti binárními předponami, zobrazuje něco, co vypadá jako jiná kapacita. Aby se zmatek zmírnil, většina výrobců paměťových zařízení dnes na svých produktech a v literatuře uvádí vysvětlivky, které definují přesnou hodnotu používaného prefixu.

V další části tohoto příspěvku se budeme zabývat přenosovými rychlostmi a jedinečnými úvahami, které se berou v úvahu při jejich vyjadřování pomocí dat.

.

Articles

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.