Jak můžete měřit množství informací

22. 5. 2019

Je pravda, že nedostatek zpráv je sama o sobě dobrá zpráva? Kamenná deska, jejíž hmotnost se rovná třem tunám, může archeologům poskytnout stejné množství informací jako vysoce kvalitní fotografie v dobré archeologické publikaci, že? A když se v rozhlasovém studiu v Kyjevě objeví nejnovější zprávy, oba obyvatelé Kyjeva a obyvatel města Illichivsk se o tom všechno dozví, a to bez ohledu na skutečnost, že energie rádiových vln v Kyjevě je daleko víc než stovky kilometrů. Ukazuje se, že ani moc, ani velikost, ani množství nemohou hrát roli měřítka informací. Jak potom odhadujeme toto nebo toto množství dat? množství informací

Novinka

Z kurzu informatiky víme, že množství informací zpracovávaných počítači je měřeno v bitech, bajtech a násobcích z nich. To však nevysvětluje, jak lze takové znalosti aplikovat v každodenním životě. Například, jak byste hodnotili získané informace v důsledku čtení tohoto článku? Bylo by fér říkat, že čím víc dopisů je, tím více se to ukáže? A pokud po přečtení tohoto článku o týden později obdržíte stejné množství informací jako předtím? Odpověď je zřejmá. To vše naznačuje myšlenku, že z hlediska novosti je prostě nemožné ji měřit. Žádný bit vám pomůže. množství informací

Hlasitost

Ale v této technice může být množství informací měřeno jako počet znaků nebo signálů, které ukládají, vysílají a zpracovávají technická zařízení. Tento přístup je založen na počítání znaků v každé konkrétní zprávě. Například slovo "mír" v angličtině je napsáno v pěti písmenách - míru, v ruštině - tři a v KOI8, 24 bitů se používá pro jeho přenos: 111011011110100111110010. To je místo, kde megabajty, kilobyty a terabajty nacházejí jejich využití. informačních opatření

Pravděpodobnost

Existuje jiný přístup, podle kterého se informace považují za zrušení nejistoty. Z tohoto pohledu, čím více dat dostáváme, tím méně naší nevědomosti a většímu povědomí. Množství informací zde je také definováno v bitech a jeden nebo jiný pravděpodobnostní výsledek z jedné dvojice stejně možných událostí ("ne" nebo "ano", "0" nebo "1") je považován za jednotku měření. Například mince je hodena pro kreslení. Orel nebo ocasy mohou spadnout. Zpráva, že padá ocas, snižuje nejistotu na polovinu a její velikost odpovídá jednomu. V případě, kdy je počet stejně možných událostí vyšší než 2, rovnost R. Hartleyho se používá k vyhodnocení zprávy, která je obvykle psána jako:

2 I = N nebo I = log 2 N, kde

N je počet všech možných událostí,

I - množství informací v bajtech.

Někdy je tento vzorec zapsán v upravené podobě: I = log 2 (1 / p) = - log 2 p. Symbol "p" v tomto případě označuje pravděpodobnost výskytu všech stejně pravděpodobných výsledků. Předpokládejme například, že jsou vyhozeny dva pravidelné hrací kostky. Je nutné určit, kolik bitů nese zprávu, že jedna z nich má pět a druhá má dvě. Je snadné počítat, že pravděpodobnost každé z těchto událostí je jedna šestina. Proto I = 2 * log 2 6 = 2 * 2,585 = 5,17 bitů. Jak můžete vidět, měření informací závisí do značné míry na rozsahu použití a zvoleném přístupu. Je obtížné si představit, jak důležitá je v současnosti. Pravděpodobně po čase je to nejdůležitější zdroj, který může mít moderní člověk.