Co je kódování a dekódování informací? Kódování abecedy

16. 5. 2019

Moderní svět je postaven na využití a přenos informací. Ale nemůžete jí říct všem svým hlasem. Proto je po dlouhou dobu důležitý moment kódování dat, aby mohli být čteny těmi, pro které byla určena. Postupně se jejich šifrování také stalo relevantním. Bylo nutné, aby informace o zprávách, které jí byly jasné, nebyly zcela jasné a ostatním neodhalily význam. Budeme o tom všechno mluvit a zjistíte, jaké jsou kódování a dekódování.

Chápeme terminologii

co je kódování a dekódování Bez tohoto v žádném případě. Když hovoří o kódovaném textu, znamená to, že byl spojen s jinou sadou znaků. To lze využít ke zvýšení spolehlivosti nebo z jednoduchého důvodu, že kanál může používat pouze omezený počet znaků. Například binární kód, na kterém pracují moderní počítače, je založen na nulach a ty,

Informace lze kódovat určitými znaky a uložit je. Jako příklad můžeme citovat výsledky analýz, které obsahují ukazatele lidského těla. Ale nejpopulárnější otázka je: "Co je kódování a dekódování v informatice?" Budeme hledat odpověď na to.

O významu

Dříve proces kódování a dekódování informací hrál podpůrnou roli a nebyl považován za samostatnou oblast matematiky. Ale s příchodem elektronických počítačů se situace výrazně změnila. Nyní je kódování ústředním problémem při řešení široké škály praktických problémů v programování, a proto proniká do všech informačních technologií. Takže s jeho pomocí:

  1. Informace jsou chráněny před neoprávněným přístupem.
  2. Poskytuje odolnost proti šumu při přenosu přes datové komunikační kanály.
  3. Zobrazí se informace o libovolné povaze (grafika, text, čísla) v paměti počítače.
  4. Komprimovaný obsah databáze.

O abecedě

kódování a dekódování Když mluvíme o tom, co je kódování a dekódování, je obtížné přehlédnout základ tohoto všeho. Jmenovitě abeceda. Existují dva typy - zdroj a kód. V první je původní informace. Kódem se rozumí změněná data, která však, pokud je k dispozici klíč, může vysílat šifrovaný obsah. Ve výpočetní technice se používá binární kód založený na abecedě sestávající z nuly a jedné.

Podívejme se na malý příklad. Předpokládejme, že máme dvě abecedy (A a B), které sestávají z konečného počtu znaků. Předpokládejme, že vypadají takto: A = {A0, A1, A2 ... A33}, B = {B0, B1, B3 ... B34}. Prvky abecedy jsou písmena. Zatímco jejich uspořádaná množina se nazývá slovo. Má určitou délku. První písmeno slova se nazývá začátek (předpona), zatímco poslední písmeno se nazývá konec (postfix). Pro konstrukci struktur mohou existovat různá pravidla. Například některé systémy informace o kódování vyžadují, aby mezi slovy byla mezera, ta bez ní. Obecně platí, že abeceda je nezbytná pro vytvoření univerzálního systému pro zobrazování informací, jejich ukládání, zpracování a přenos. V tomto případě existuje určitá korespondence mezi různými signály a prvky zpráv, které jsou v nich zašifrovány.

Práce s daty

kódování a dekódování Když je informace převedena do původní podoby, probíhá proces, který se nazývá dekódování. Musí být provedena ve vztahu ke všem šifrovaným datům. V tomto případě se používá tzv. Inverzní mapování (bijekce). Podívejme se na situaci v binárním systému. Má všechna kódová slova stejné délky. Kód se proto nazývá jednotný (blok). V tomto případě je kódovací funkce určitou náhradou. Vezměte jako příklad výše uvedený abecední systém. Označit určité sekvence pomocí sady základních kódů.

Předpokládejme, že máme A0 = {A, B, C, D} a B0 = {1, 0}. Jak je možné to prezentovat na počítači? A pomocí následujícího posloupnosti: A = 00, B = 01, B = 10, D = 11. Jak vidíte, každý znak má specifické kódování. Referenční informace o kódovací abecedě jsou zadávány do počítačového zařízení a začne čekat na příchozí signály. Nula přichází a následuje další - jo, tak je to dopis A. Pokud v textovém editoru nakreslíme paralely s psaním slova, pak by mělo být poznamenáno, že bude předáno nejen jedno písmeno, ale bude zahájena odpovídající reakce. Například se rozsvítí určitý sled monitorových LED, kde se zobrazí všechny zadané znaky.

Specifika práce

binární kód Když mluvíme o příkladech kódování a dekódování informací, je třeba poznamenat, že zvažovaný systém není individuální. Například písmeno A může odpovídat kombinaci nejen 00, ale také 11, 10 nebo 01. Mělo by však mít na paměti, že může existovat pouze jedna věc. To znamená, že pouze kombinace je přiřazena pouze určitému znaku. Pokud kódovací schéma znamená rozdělení nějakého slova na elementární součásti, pak se nazývá oddělitelné. V případech, kdy jedno písmeno nečiní jako začátek jiného, ​​je to předponový přístup. To se týká problémů softwaru a hardwaru. Architektura má také určitý vliv na kódování, ale kvůli velkému množství možností implementace je spíše problematické to zvažovat.

Kódování písmen

To je nejjednodušší přístup. Pokud hovoříme o kódování informací, možná je to nejoblíbenější volba. V omezené verzi byla výše uvedena. Zjistíme, jak vypadá kód bez oddělovačů. Předpokládejme, že máme abecedu (zdroj), ve které jsou umístěny všechny ruské dopisy. Desítkové číslice se používají pro kódování. Zde A = 1 a I = 33. Tedy posloupnost písmen AJAA může být označována jako 133331. Pokud je potřeba učinit abecedu jednotnou, je třeba provést určité změny. Takže pro prvních devět dopisů musíte přidat nulu. A příklad AJAA, který jsme zvažovali, se změní na 01333301.

Nerovnoměrné kódování

Možnost zvažovaná dříve je považována za vhodnou. Ale v některých případech je chytřejší vsadit na nejednotné kódy. To má smysl, když se různá písmena ve zdrojovém textu vyskytují na různých frekvencích. Proto je vhodné zakódovat častější znaky s krátkými symboly a vzácné symboly s dlouhými symboly. Postavme binární strom písmen ruské abecedy. A navíc budeme mít speciální postavy. Nejčastěji používané písmena jsou, a tak začneme s nimi: A - 0, B - 1, C - 10, G - 11 a tak dále. A pouze po nich budou použity otazníky, procenta, dvojtečky a další. Ačkoli by možná měly být na prvním místě ještě čárky a období.

O stavu Fana

kódování a dekódování signálu Věta říká, že jakýkoli kód (prefix a uniforma) připouští možnost jedinečného kódování. Předpokládejme, že použijeme dříve uvažovaný příklad s číslem 01333301. Začneme se přesouvat doprava. 0 nám nedává nic. Ale 01 vám umožňuje určit písmeno A. Trochu změňte počáteční kód a představte ho jako 01 333301. Dále vyberte první I, druhou a druhou A. V důsledku toho máme 01 33 33 01. Ačkoli byl kód původně sloučeny, ale nyní můžeme snadné dekódování, protože víme, co to je. Jmenovitě - JSEM A. Zároveň si všimněte, že je vždy jednoznačně dekódován a v rámci přijatého systému neexistují žádné interpretace, díky nimž je možné zajistit vysokou spolehlivost přenášených informací. Ale jak fungují počítače?

Fungování elektronických počítačů

Kódování a dekódování signálů výpočetní techniky je založeno na použití takzvaných nízkých a vysokých signálů, které odpovídají nulovému a logickému rozměru. Co to znamená? Řekněme, že máme mikrokontrolér. Pokud jeden z jeho vstupů přijímá nízké napětí 1,5 V, pak se má za to, že byla předána hodnota logické nuly. Pokud je přenášeno 5 V, zapíše se jednotka do odpovídající paměti. Současně je nutné dosáhnout dohody o zdroji informací komunikačního kanálu. Obecně platí, že při vytváření elektroniky je třeba vzít v úvahu velké množství různých bodů. Jedná se o požadavky na energii, druh přenášených informací (diskrétní nebo kontinuální) a mnohem více. Současně musí být data nepřetržitě přeměněna tak, aby mohla být přenášena prostřednictvím komunikačních kanálů. Takže v případě binární technologie jsou signály reprezentovány jako napětí dodávané na vstup tranzistorů nebo jiných komponent. Během dekódování data převedou zprávu do druhu srozumitelného pro příjemce.

Minimální redundance

systémy kódování informací V praxi se ukázalo, že je velmi důležité, aby kód zprávy měl minimální délku. Zpočátku se může zdát, že jaký rozdíl - šest, osm nebo šestnáct bitů se používá pro kódování? Rozdíly však nejsou významné, pokud se použije jedno slovo. A jestli miliardy? Naštěstí můžete upravit abecední kódování pro všechny požadavky. Ale pokud se o sadě nenachází nic, pak je v tomto případě poměrně obtížné formulovat optimalizační problém. V praxi však zpravidla získáte další informace. Zvažte malý příklad. Předpokládejme, že máme zprávu zaslanou v přirozeném jazyce. Ale je zakódován a my ho nemůžeme číst. Co nám pomůže při dekódování? Jako jednu z možných možností - kus papíru, na kterém je distribuována pravděpodobnost výskytu písmen. Díky tomu je konstrukce optimálního kódu z hlediska de / kódování možná s použitím přesné matematické formulace a přísného řešení.

Příklad příkladu

Předpokládejme, že máme definovatelnou oddělitelnou abecední schéma kódování. Pak budou mít tato vlastnost i všechny deriváty, které jsou objednávanou sadou. Kromě toho, pokud je délka základních kódů stejná, jejich permutace neovlivní délku celé zprávy. Ale pokud velikost přenášených informací přímo závisí na posloupnosti písmen, znamená to, že byly použity komponenty různých délek. Současně, pokud existuje specifická zpráva a její kódovací schéma, je možné zvolit takové řešení problému, pokud bude jeho délka minimální. Jak to dosáhnout? Podívejme se na přístup pomocí algoritmu pro přiřazení elementárních kódů, který nám umožňuje účinně přistupovat k řešení problému efektivity:

  1. Dopisy by měly být seřazeny v sestupném pořadí kvantitativního výskytu.
  2. Je nutné umístit základní kódy tak, aby se jejich délka zvyšovala.
  3. A jako závěr je nutné umístit součásti v optimálním pořadí tak, aby nejčastější znaky zabíraly nejmenší prostor.

Obecně je systém jednoduchý. Pokud pracujete s malým množstvím dat. Ale s moderními počítači to je poměrně problematické při implementaci díky velkému množství informací.

Závěr

jazyky kódování informací Takže jsme se podívali na to, co je kódovací a dekódovací systém, co to může být, co nyní existuje v informatice, stejně jako mnoho dalších otázek. Ale mělo by být zřejmé, že toto téma je extrémně objemné, jeden článek nestačí. Jako pokračování tohoto tématu můžeme uvažovat o šifrování dat, kryptografii, změně zobrazení informací v různých elektronických zařízeních, úrovních zpracování a mnoho dalších bodů. Ale odvětví informatiky je považováno za jedno z nejobtížnějších, proto studium všech to rychle nebude fungovat. Vedle teoretických znalostí zde oh, jak se nerovná praktickým dovednostem. Konkrétně jde o kvalitní výsledek.