Odběr vzorků je ... Definice, typy, metody a výsledky vzorkování

25. 2. 2019

Často se stává, že je nutné analyzovat určitý společenský jev a získat informace o něm. Tyto úkoly často vznikají ve statistikách a statistických studiích. Zkontrolujte úplně definovaný sociální fenomén je často nemožné. Například, jak zjistit názor obyvatel nebo všech obyvatel určitého města o jakékoli otázce? Zeptat se absolutně každý je téměř nemožný a velmi namáhavý. V takových případech potřebujeme ukázku. To je přesně ten pojem, na němž jsou prakticky všechny výzkumy a analýzy založeny.

Co je vzorkování

Při analýze konkrétního společenského jevu je nutné získat informace o něm. Pokud provedete nějakou studii, uvidíte, že ne každá jednotka předmětu studia je předmětem výzkumu a analýzy. Zohledňuje se pouze určitá část celého agregátu. Tento proces je vzorkování: když jsou zkoumány pouze určité jednotky sady.

Samozřejmě, hodně závisí na typu vzorku. Existují však základní pravidla. Nejdůležitější z nich uvádí, že výběr z agregátu by měl být zcela náhodný. Jednotky agregátu, které se má použít, by neměly být vybrány z důvodu jakýchkoli kritérií. Zhruba řečeno, pokud je nutné shromáždit agregát obyvatel určitého města a zvolit pouze muže, pak se ve studii objeví chyba, protože výběr nebyl náhodný, ale byl zvolen na základě pohlaví. Prakticky všechny metody odběru vzorků vycházejí z tohoto pravidla.

typy vzorků

Pravidla výběru

Aby vybraná populace odrážela základní vlastnosti celého jevu, musí být postavena podle konkrétních zákonů, přičemž by se měla zaměřit na následující kategorie:

  • vzorek (vzorek);
  • obecná populace;
  • reprezentativnost;
  • chyba reprezentativnosti;
  • jednotka agregátu;
  • způsoby sestavení vzorku.

Vlastnosti vzorkování a odběru vzorků jsou následující:

  1. Všechny získané výsledky jsou založeny na matematických zákoních a pravidlech, tj. S řádným výzkumem as řádnými výpočty, výsledky nebudou subjektivně deformovány.
  2. Umožňuje dosahovat mnohem rychlejších výsledků a méně času a zdrojů, a ne zkoumat celou řadu událostí, ale jen část z nich.
  3. Může být aplikován na studium různých předmětů: od konkrétních otázek, např. Věku, pohlaví skupiny zájmu ke studiu veřejného mínění nebo úrovně hmotné podpory obyvatelstva.

Náhodné pozorování

Selektivní - je to statistické pozorování, ve kterém studium není podrobeno celé sérii studovaného, ​​ale pouze určitá část vybraného souboru určitým způsobem a výsledky studia této části se vztahují na celý soubor. Tato část se nazývá vzorová sada. To je jediný způsob, jak studovat celou řadu předmětů studia.

Ale selektivní pozorování lze použít pouze v případech, kdy je nutné prověřit pouze malou skupinu jednotek. Například při zkoumání poměru mužů k ženám ve světě se použije selektivní pozorování. Ze zřejmých důvodů nelze vzít v úvahu každého obyvatele naší planety.

Ale se stejnou studií, ale ne všichni obyvatelé země, ale určitá 2 "A" třída v konkrétní škole, určité město, určitá země, může dělat bez selektivní pozorování. Koneckonců je docela možné analyzovat celou řadu předmětů studia. Je třeba počítat chlapce a dívky této třídy - to bude poměr.

sada vzorků

Vzorek a počet obyvatel

Ve skutečnosti není všechno tak složité, jak to zní. Ve všech studijních předmětech existují dva systémy: obecný a selektivní agregát. Co to je? Všechny jednotky patří obecně. A na vzorek - ty jednotky celkové populace, které byly odebrány do vzorku. Pokud je vše správně provedeno, vybranou součástí bude snížené uspořádání celé (obecné) populace.

Pokud hovoříme o obecné populaci, můžeme rozlišit pouze dvě její odrůdy: definitní a neurčitou obecnou populaci. Závisí to na tom, zda je celkový počet jednotek tohoto systému znám nebo ne. Pokud se jedná o specifickou populaci, vzorka bude snazší, protože je známo, jaké procento z celkového počtu jednotek bude ukázkou.

Tento okamžik je ve výzkumu velmi nezbytný. Pokud je například třeba prošetřit procento cukrárenských výrobků špatné kvality v konkrétní továrně. Předpokládejme, že populace je již definována. Je známo, že tento podnik vyrábí 1000 cukrovinek ročně. Pokud vytvoříte vzorku 100 náhodných cukrářských výrobků z těchto tisíců a pošlete je na vyšetření, pak bude chyba minimální. Zhruba řečeno, studie podléhala 10% všech výrobků a podle výsledků můžeme s přihlédnutím k chybě reprezentativnosti mluvit o špatné kvalitě všech produktů.

A pokud si vyberete 100 cukrářských výrobků z nejisté obecné populace, kde ve skutečnosti byly, například, 1 milion jednotek, pak bude výsledek vzorku a samotná studie kriticky nepravděpodobné a nepřesné. Cítit rozdíl? Proto je jistota obecné populace ve většině případů velmi důležitá a výrazně ovlivňuje výsledek studie.

Obecná populace

Reprezentativnost agregátu

Takže teď jedna z nejdůležitějších otázek - jaký by měl být vzorek? To je hlavní bod studie. V této fázi je nutné vypočítat vzorek a vybrat jednotky z celkového počtu do něj. Agregát byl správně vybrán, pokud některé vzorky a charakteristiky obecné populace zůstanou ve vzorku. Toto se nazývá reprezentativnost.

Jinými slovy, jestliže po výběru část zachovává stejné tendence a rysy jako celé množství studovaného, ​​pak takový soubor se nazývá reprezentativní. Ale ne každý konkrétní vzorek může být vybrán z reprezentativní sady. Existují také objekty výzkumu, jejichž vzorkování jednoduše nemůže být reprezentativní. Zde vzniká pojem chyby reprezentativnosti. Ale hovořme o tom podrobněji trochu víc.

Jak provést výběr

Abychom maximalizovali reprezentativnost, existují tři základní pravidla pro odběr vzorků:

  1. Nejvíce jedinečný ukazatel číslo vzorku je 20%. Statistický vzorek o 20% téměř vždy dává výsledek co nejblíže skutečnosti. Současně není nutné přenést na shromážděnou většinu obyvatelstva. 20% vzorku je indikátorem, který byl vyvinut mnoha studiemi. Dáváme trochu víc teorie. Čím větší je vzorek, tím menší je chyba reprezentativnosti a přesnější výsledek studie. Čím blíže je vzorek k obecnému počtu jednotek, tím přesnější a správnější budou výsledky. Koneckonců, pokud prozkoumáte celý systém, bude výsledek 100%. Ale není tam žádný vzorek. Jedná se o studie, ve kterých se zkoumá celé pole, všechny jednotky, takže nás to nezajímá.
  2. V případě nevhodnosti zpracování 20% celkové populace je povoleno studovat jednotky agregátu v množství nejméně 1001. Jedná se také o jeden z ukazatelů studie pole předmětu studie, který se časem rozvinul. Samozřejmě, že s rozsáhlými výzkumnými objekty nedosáhne přesné výsledky, ale přinese to co nejblíže možné přesnosti vzorkování.
  3. Ve statistikách existuje mnoho vzorců a tabulkových tabulek. V závislosti na studovaném předmětu a kritériu vzorku existuje vhodnost výběru jednoho nebo jiného vzorce. Tato položka se však používá v komplexním a vícestupňovém výzkumu.
    Sada vzorku

Chyba (chyba) reprezentativnosti

Hlavní charakteristikou kvality vybraného vzorku je pojem "rozpětí chyb". Co to je? Jedná se o určité nesrovnalosti mezi ukazateli selektivního a nepřetržitého sledování. Pokud jde o chybu, reprezentativnost je rozdělena na spolehlivé, obyčejné a přibližné. Jinými slovy jsou přípustné odchylky až 3%, od 3 do 10% a od 10 do 20%. Přestože ve statistice je žádoucí, aby chyba nepřesáhla 5-6%. V opačném případě existuje důvod mluvit o nedostatečné reprezentativnosti vzorku. Pro výpočet chyby reprezentativnosti a způsobu ovlivnění vzorku nebo obecné populace se berou v úvahu řada faktorů:

  1. Pravděpodobnost, s jakou potřebujete získat přesný výsledek.
  2. Počet jednotek vzorku. Jak již bylo uvedeno výše, čím méně jednotek bude ukázkou, tím větší bude chyba reprezentativnosti a naopak.
  3. Homogenita studované populace. Čím více je heterogenní, tím větší bude chyba reprezentativnosti. Schopnost agregátu být reprezentativní závisí na homogenitě všech jeho jednotek.
  4. Metoda výběru jednotek ve vzorku.

Ve specificky specifikovaných studiích je procentní chyba průměrné hodnoty obvykle dána výzkumným pracovníkem na základě pozorovacího programu a podle údajů z předchozích studií. Zdá se, že marginální vzorkovací chyba (chyba reprezentativnosti) se pohybuje v rozmezí 3-5%.

Vedení výzkumu

Více není vždy lepší

Za zmínku stojí také to, že hlavním úkolem při organizaci selektivního pozorování je přivést jeho objem na přijatelné minimum. V takovém případě by se nemělo usilovat o přílišné omezení limitů chyby při výběru vzorku, protože to může vést k neoprávněnému zvýšení množství údajů o vzorku a v důsledku toho k nárůstu nákladů na odběr vzorků.

Současně není možné příliš zvýšit velikost chyby reprezentativnosti. V tomto případě bude v tomto případě, i když dojde k poklesu objemu vzorku, což povede ke zhoršení spolehlivosti získaných výsledků.

Jaké otázky jsou obvykle kladeny výzkumnému pracovníkovi

Jakákoli studie, pokud je provedena, je pro nějaký účel a získat nějaké výsledky. Při provádění selektivní studie se zpravidla kladou počáteční otázky:

  1. Stanovení požadovaného počtu jednotek vzorku, tj. Kolik jednotek bude zkoumáno. Navíc, pro přesné studium by měla být úplnost reprezentativní.
  2. Výpočet chyby reprezentativnosti se stanovenou úrovní pravděpodobnosti. Bezprostředně stojí za zmínku, že selektivní výzkum se nestává s pravděpodobností 100%. Pokud autorita, která provedla studii určitého segmentu, tvrdí, že jejich výsledky jsou přesné s pravděpodobností 100%, pak je to falešné. Dlouhodobá praxe již stanovila procento pravděpodobnosti správně provedené selektivní studie. Toto číslo je 95,4%.
    Jak vzorkovat

Metody výběru jednotek výzkumu ve vzorku

Ne každý vzorek je reprezentativní. Někdy je totožné označení jinak vyjádřeno jako celek a v jeho části. Pro splnění požadavků na reprezentativnost je vhodné používat různé techniky odběru vzorků. Navíc použití jednoho nebo jiného způsobu závisí na konkrétních okolnostech. Mezi takové metody tvorby vzorku patří:

  • náhodný výběr;
  • mechanický výběr;
  • typický výběr;
  • sériový (chovný) výběr.

Náhodný výběr vzorků je systém opatření zaměřených na náhodný odběr vzorků populačních jednotek, kdy je pravděpodobnost, že do vzorku vstoupí, stejná pro všechny jednotky obecné populace. Tato technika je vhodná pouze pro homogenitu a malý počet charakteristických vlastností. V opačném případě jsou některé charakteristiky vystaveny riziku, že nebudou ve vzorku odráženy. Známky náhodného výběru jsou základem všech ostatních metod odběru vzorků.

Při mechanickém výběru jednotek se provádí v určitém intervalu. Je-li třeba vytvořit vzorek konkrétních trestných činů, každá 5., 10. nebo 15. karta může být odebrána ze všech statistických záznamů o zaznamenaných zločinech, v závislosti na jejich celkovém počtu a velikosti vzorku. Nevýhodou této metody je to, že před odběrem vzorků je nutné mít úplný přehled o agregovaných jednotkách, pak by mělo být provedeno hodnocení a teprve poté je možné provést vzorek v určitém intervalu. Tato metoda trvá hodně času, takže se často nepoužívá.

Odběr vzorků

Typický (zónový) výběr je typ výběru, ve kterém je obecná populace rozdělena do homogenních skupin podle určitého atributu. Někdy výzkumníci používají místo "skupin" jiné výrazy: "oblasti" a "zóny". Potom se z každé skupiny v náhodném pořadí vybere určitý počet jednotek v poměru k hmotnosti skupiny v celkové populaci. Typický výběr se často provádí v několika etapách.

Sériová volba je metoda, při které je výběr jednotek prováděn ve skupinách (série) a všechny jednotky vybrané skupiny (řady) jsou předmětem zkoušky. Výhodou této metody je, že někdy je obtížnější vybrat jednotlivé jednotky než řadu, například při studiu osoby, která slouží trestu. Ve vybraných oblastech, zónách, se provádí studium všech jednotek bez výjimky, například studium všech osob vykonávajících trest v konkrétní instituci.

Přečíst předchozí

Geografie Evropy. Stát Andorra

Přečtěte si další

Heroismus je komplexní koncept.