Головне меню
Головна Підручники Правова статистика ПРАВОВА СТАТИСТИКА § 4. Основні положення вибіркового спостереження

§ 4. Основні положення вибіркового спостереження

Правова статистика - ПРАВОВА СТАТИСТИКА
121

§ 4. Основні положення вибіркового спостереження

При вибірковому спостереженні можуть виникати помилки реєстрації і похибки вибірки (репрезентативності).

Помилки реєстрації, як і при суцільному статистичному спостереженні, являють собою розбіжність між зафіксованими даними в процесі спостере­ження і дійсними даними. Вони можуть бути випадковими і систематичними. Як правило, помилки реєстрації при вибірковому спостереженні зустріча­ються рідко, тому що значно менший обсяг роботи приходиться на одного реєстратора, самі реєстратори завжди більш кваліфіковані, чим при прове­денні суцільного спостереження.

Як уже відзначалося раніше, похибки репрезентативності властиві будь-якому вибірковому спостереженню. Завдання організації правильного проведення вибіркового спостереження – це вибір такої похибки репрезента­тивності, яка б задовольняла дослідника при даному спостереженні.

Зупинимось на основних термінах вибіркового спостереження. Основні поняття: генеральна і вибіркова сукупності. Генеральна сукупність – це уся сукупність одиниць, з якої проводиться відбір частини одиниць для вибірко­вого спостереження. Відібрана певним способом частина генеральної сукуп­ності для вибіркового спостереження називається вибірковою сукупністю. Узагальнюючі показники генеральної сукупності називаються генеральни­ми, а відповідні по­казники вибіркової сукупності – вибірковими. Позначен­ня показників генеральної та вибіркової сукупності наведено в табл. 13.

Таблиця 13.

Позначення показників генеральної і вибіркової сукупності

Переваги вибіркового спостереження перед суцільним реалізуються лише при додержані наукових принципів його організації і проведення, на­самперед

неупередженого, випадкового відбору одиниць для спостереження. Вибіркова сукупність повинна повністю відтворювати склад генеральної су­купності. Принцип випадковості відбору забезпечує усім одиницям гене­ральної сукупності рівні можливості потрапити у вибіркову сукупність.

При проведенні вибіркового спостереження слід спиратися на знання закону великих чисел і теорії імовірності. Якби ні проводився відбір одиниць сукупності, завжди будуть розбіжності між характеристиками генеральної і вибіркової сукупностей, які пов'язані із сутністю вибіркового методу. Части­на завжди відрізняється від цілого. Розбіжності між показниками генеральної і вибіркової сукупностей називається похибкою репрезентативності. Середня в генеральній сукупності відрізняється від середньої у вибірковій сукупності на величину похибки репрезентативності:

,

де: ? – похибка репрезентативності.

Наприклад, після проведення вибіркового спостереження з`ясувалось, що середній вік рецидивістів дорівнює 32 роки. Похибка репрезентативності становить ± 5%, інакше кажучи – 1,6 роки. Середній вік рецидивістів, в усій сукупності, якщо вивчити їх усіх, дорівнюватиме 32,0 ± 1,6, тобто він буде коливатися в межах від 30,4 року до 33,6 років.

Згідно з теоремою Чебишева з уточненнями Ляпунова, математикою було доведено, що при достатньо великій кількості обстежених одиниць су­купності середня величина досліджуваної ознаки у вибірковій сукупності бу­де відрізнятися від середньої величини в генеральній сукупності на величи­ну:

,

де: ? (дельта) – гранична похибка вибірки, тобто похибка репрезента­тивності; ? (мю) – середня похибка вибірки; t – коефіцієнт, що залежіть від імовірність, з якою можна гарантувати певний розмір похибки репрезента­тивності. Якщо t = 0, то імовірність також дорівнює 0; якщо t = 0,5, то імо­вірність дорівнює 0,383, або 38,3%; якщо t = 1, то імовірність дорівнює 0,683, або 68,3%; якщо t = 2, то ймовірність дорівнює 0,954, або 95,4%; якщо t = 3, то ймовірність дорівнює 0,997 або 99,7 %; якщо t = 4, то імовірність стано­вить 0,999936 і т.п. При цьому варто врахувати, що даний коефіцієнт може приймати не тільки цілі числа, але й дробові значення.

Із наведеної формули видно, що похибка репрезентативності залежить від багатьох чинників: імовірності, з якою ми бажаємо одержати результат; чисельності одиниць вибіркової сукупності (чим менше одиниць складатиме вибіркова сукупність, тим більше буде похибка репрезентативності, і навпа­ки); однорідності досліджуваної сукупності (чим більш різнорідна сукупні­сть, тим похибка репрезентативності буде більше) і від способу відбору одиниць в вибіркову сукупність.

Як правило, при проведенні вибіркового спостереження перед дослід­ником для успішного його проведення необхідно визначення необхідної кіль­кості одиниць вибіркової сукупності та розрахунок похибки репрезентатив­ності з встановленим рівнем імовірності.

Багаторічна практика свідчить, що довірча імовірність 95,4 % (для t = 2) є оптимальної для більшості розрахунків у різних галузях господарства, тим більше для правових явищ. Тому для полегшення досить громіздких роз­рахунків похибки вибіркового спостереження існують спеціальні таблиці. Межі похибки при певному числі спостережень з довірчою імовірністю 95,4% – табл. 14. Визначення чисельності вибіркового спостереження при заданій величині похибки репрезентативності з довірчою імовірністю 95,4 % – табл. 15).

Таблиця 14

Величина похибки вибірки при даному числі спостережень

На підставі даних, які наведені в табл. 14, видно, що чим більше оди­ниць попадає до вибіркової сукупності, тим менше буде можлива похибка вибірки.

У конкретно-правових дослідженнях, як правило, задається відсоток похибки середнього значення самим дослідником на основі програми спосте­реження і відповідно до даних раніш проведених досліджень. Як правило, вважається допустимою гранична похибка вибірки (похибка репрезентатив­ності) в межах 3 – 5 %.

Якщо допустити похибку в два рази більшу, то обсяг вибірки можна зменшити в чотири рази і навпаки, якщо необхідно зменшити похибку вибірки в два рази, то обсяг вибірки треба збільшити в чотири рази.

Слід звернути увагу, що табл. 14 побудована для власне випадкового способу відбору одиниць у вибіркову сукупність, тому її з більшим ступенем вірогідності можна використовувати її при механічному і типовому способах відбору одиниць у вибіркову сукупність. При серійному (гніздовому) спосо­бу відбору одиниць у вибірку використовувати дані, які наведені в табл. 14 і 15, не можна. (Більш детально способи відбору одиниць у вибіркову сукуп­ність викладені в наступному параграфі цього розділу).

Як можна і треба користуватися вищенаведеною табл. 14? Наприклад, припустимо, що на основі обстеження 200 осіб, яких засуджено за тяжкі насильницькі злочини, було встановлено, що 65% з них вчинені в стані алкогольного сп'яніння. Нас цікавить, наскільки достовірний цей результат, тобто в яких межах коливається дане значення у всій генеральній сукупності.

За даними табл. 14 визначаємо, що на перетинанні горизонтального рядка з числом 65 з вертикальною другою графою з числом 200, знаходиться число 6,8. Це означає, що частка засуджених, що вчинили тяжкі насильницькі злочини в стані сп'яніння, може коливатися в межах від 58,2 % до 71,8 % (65% 6,8 %).

Таблиця 14 дає можливість відповісти на запитання, яке мінімальне чи­сло одиниць сукупності необхідно включити до вибіркової сукупності, щоб очікуваний результат похибки репрезентативності коливався у встановлених межах.

Найважливіше завдання при проведенні вибіркового дослідження пра­вових явищ – це визначення репрезентативного обсягу вибіркового спостере­ження, тобто скільки необхідно проаналізувати одиниць з генеральної сукуп­ності, щоб одержана випадкова похибка середнього значення досліджуваної ознаки не перевершувала визначеної величини похибки репрезентативності з достатньою імовірністю.

Спираючись на математичні теореми закону великих чисел, можна встановити, що при зменшенні обсягу вибірки в декілька квадратів разів по­хибка середнього значення збільшується в стільки ж разів, і навпаки, змен­шення похибки середнього значення вибірки в декілька разів призводить до збільшення обсягу вибірки в стільки ж квадратів разів. Отже, визначення величини похибки середнього значення ознаки для встановлення обсягу вибірки має велике значення.

При практичному застосуванні формул дослідник завжди зустрічається з тим, що необхідні дані про коливання ознаки в генеральній сукупності. Як правило, на практиці для визначення обсягу вибірки прибігають до даних попередніх досліджень або проводять так звані пробні обстеження і на їх основі визначають орієнтовні розміри коливання ознаки.

Взагалі слід пам'ятати, що головне при організації вибіркового спосте­реження – це доведення обсягу його до допустимого мінімуму. При цьому не слід прагнути до надмірного зменшення меж похибки вибірки, тому що це може призвести до невиправданого збільшення обсягу вибірки і, отже, до підвищення витрат на проведення вибіркового спостереження. В той же час не можна і надмірно збільшувати розмір похибки репрезентативності, тому що в цьому випадку хоча і відбудеться зменшення обсягу вибіркової сукуп­ності, але це призведе до погіршення достовірності одержаних результатів.

Таблиця 15

Обсяг вибіркової сукупності при заданій похибки репрезентативності

Наведемо приклад визначення чисельності вибірки на основі табл. 15. Припустимо, що величина досліджуваного показника дорівнює 40 % (частка (питома вага) тяжких злочинів в області), а похибка репрезентативності, яку вважаємо допустимою при даному дослідженні, не повинна бути більш 4 %. По табл. 15 визначаємо, що мінімальний обсяг вибіркової сукупності пови­нен скласти 600. Отже, щоб наше вибіркове дослідження було репрезентатив­ним з довірчою імовірністю в 95,4 % за наших вихідних даних, нам необхід­но обстежити мінімум 600 чоловік засуджених.

Якщо таблиці 14 і 15 відсутні, то в цьому випадку обсяг вибіркової сукупності обчислюється на базі раніш наведеної формули шляхом нескладного її перетворення. Формула для встановлення обсягу вибіркової сукупності буде мати вигляд:

,

де: n – обсяг вибіркової сукупності; w – частина одиниць, які мають дану ознаку; t – коефіцієнт; ? – похибка репрезентативності.

Наприклад, у вибіркову сукупність необхідно взяти 470 – 500 одиниць, щоб із імовірністю 95,4% можна було стверджувати, що похибка репрезента­тивності при обчисленні частки сукупності не буде відхилятися більше, ніж на ± 4%, якщо відомо, що значення частки у сукупності досягає 25%, тобто за вищенаведеною формулою: .

У більшості випадків при вибіркових дослідженнях дані аналізуються і збирають не по одному, а по декількох ознаках одночасно. У цьому випадку необхідний обсяг вибіркової сукупності визначається по кожній з цих ознак, а потім приймається для дослідження максимальна величина по одній з найбільш істотних ознак.

При наявності якісної сукупності альтернативних ознак (подія може або наступити, або не наступити), якщо не відома реальна величина коливання ознаки, то його величина приймається рівнозначній 50%. (Більш детально це відображено в розділі УШ).

 

< Попередня   Наступна >