§ 4. Основні положення вибіркового спостереження
Правова статистика - ПРАВОВА СТАТИСТИКА |
§ 4. Основні положення вибіркового спостереження
При вибірковому спостереженні можуть виникати помилки реєстрації і похибки вибірки (репрезентативності).
Помилки реєстрації, як і при суцільному статистичному спостереженні, являють собою розбіжність між зафіксованими даними в процесі спостереження і дійсними даними. Вони можуть бути випадковими і систематичними. Як правило, помилки реєстрації при вибірковому спостереженні зустрічаються рідко, тому що значно менший обсяг роботи приходиться на одного реєстратора, самі реєстратори завжди більш кваліфіковані, чим при проведенні суцільного спостереження.
Як уже відзначалося раніше, похибки репрезентативності властиві будь-якому вибірковому спостереженню. Завдання організації правильного проведення вибіркового спостереження – це вибір такої похибки репрезентативності, яка б задовольняла дослідника при даному спостереженні.
Зупинимось на основних термінах вибіркового спостереження. Основні поняття: генеральна і вибіркова сукупності. Генеральна сукупність – це уся сукупність одиниць, з якої проводиться відбір частини одиниць для вибіркового спостереження. Відібрана певним способом частина генеральної сукупності для вибіркового спостереження називається вибірковою сукупністю. Узагальнюючі показники генеральної сукупності називаються генеральними, а відповідні показники вибіркової сукупності – вибірковими. Позначення показників генеральної та вибіркової сукупності наведено в табл. 13.
Таблиця 13.
Позначення показників генеральної і вибіркової сукупності
Переваги вибіркового спостереження перед суцільним реалізуються лише при додержані наукових принципів його організації і проведення, насамперед
При проведенні вибіркового спостереження слід спиратися на знання закону великих чисел і теорії імовірності. Якби ні проводився відбір одиниць сукупності, завжди будуть розбіжності між характеристиками генеральної і вибіркової сукупностей, які пов'язані із сутністю вибіркового методу. Частина завжди відрізняється від цілого. Розбіжності між показниками генеральної і вибіркової сукупностей називається похибкою репрезентативності. Середня в генеральній сукупності відрізняється від середньої у вибірковій сукупності на величину похибки репрезентативності:
,
де: ? – похибка репрезентативності.
Наприклад, після проведення вибіркового спостереження з`ясувалось, що середній вік рецидивістів дорівнює 32 роки. Похибка репрезентативності становить ± 5%, інакше кажучи – 1,6 роки. Середній вік рецидивістів, в усій сукупності, якщо вивчити їх усіх, дорівнюватиме 32,0 ± 1,6, тобто він буде коливатися в межах від 30,4 року до 33,6 років.
Згідно з теоремою Чебишева з уточненнями Ляпунова, математикою було доведено, що при достатньо великій кількості обстежених одиниць сукупності середня величина досліджуваної ознаки у вибірковій сукупності буде відрізнятися від середньої величини в генеральній сукупності на величину:
,
де: ? (дельта) – гранична похибка вибірки, тобто похибка репрезентативності; ? (мю) – середня похибка вибірки; t – коефіцієнт, що залежіть від імовірність, з якою можна гарантувати певний розмір похибки репрезентативності. Якщо t = 0, то імовірність також дорівнює 0; якщо t = 0,5, то імовірність дорівнює 0,383, або 38,3%; якщо t = 1, то імовірність дорівнює 0,683, або 68,3%; якщо t = 2, то ймовірність дорівнює 0,954, або 95,4%; якщо t = 3, то ймовірність дорівнює 0,997 або 99,7 %; якщо t = 4, то імовірність становить 0,999936 і т.п. При цьому варто врахувати, що даний коефіцієнт може приймати не тільки цілі числа, але й дробові значення.
Із наведеної формули видно, що похибка репрезентативності залежить від багатьох чинників: імовірності, з якою ми бажаємо одержати результат; чисельності одиниць вибіркової сукупності (чим менше одиниць складатиме вибіркова сукупність, тим більше буде похибка репрезентативності, і навпаки); однорідності досліджуваної сукупності (чим більш різнорідна сукупність, тим похибка репрезентативності буде більше) і від способу відбору одиниць в вибіркову сукупність.
Як правило, при проведенні вибіркового спостереження перед дослідником для успішного його проведення необхідно визначення необхідної кількості одиниць вибіркової сукупності та розрахунок похибки репрезентативності з встановленим рівнем імовірності.
Багаторічна практика свідчить, що довірча імовірність 95,4 % (для t = 2) є оптимальної для більшості розрахунків у різних галузях господарства, тим більше для правових явищ. Тому для полегшення досить громіздких розрахунків похибки вибіркового спостереження існують спеціальні таблиці. Межі похибки при певному числі спостережень з довірчою імовірністю 95,4% – табл. 14. Визначення чисельності вибіркового спостереження при заданій величині похибки репрезентативності з довірчою імовірністю 95,4 % – табл. 15).
Таблиця 14
Величина похибки вибірки при даному числі спостережень
На підставі даних, які наведені в табл. 14, видно, що чим більше одиниць попадає до вибіркової сукупності, тим менше буде можлива похибка вибірки.
У конкретно-правових дослідженнях, як правило, задається відсоток похибки середнього значення самим дослідником на основі програми спостереження і відповідно до даних раніш проведених досліджень. Як правило, вважається допустимою гранична похибка вибірки (похибка репрезентативності) в межах 3 – 5 %.
Якщо допустити похибку в два рази більшу, то обсяг вибірки можна зменшити в чотири рази і навпаки, якщо необхідно зменшити похибку вибірки в два рази, то обсяг вибірки треба збільшити в чотири рази.
Слід звернути увагу, що табл. 14 побудована для власне випадкового способу відбору одиниць у вибіркову сукупність, тому її з більшим ступенем вірогідності можна використовувати її при механічному і типовому способах відбору одиниць у вибіркову сукупність. При серійному (гніздовому) способу відбору одиниць у вибірку використовувати дані, які наведені в табл. 14 і 15, не можна. (Більш детально способи відбору одиниць у вибіркову сукупність викладені в наступному параграфі цього розділу).
Як можна і треба користуватися вищенаведеною табл. 14? Наприклад, припустимо, що на основі обстеження 200 осіб, яких засуджено за тяжкі насильницькі злочини, було встановлено, що 65% з них вчинені в стані алкогольного сп'яніння. Нас цікавить, наскільки достовірний цей результат, тобто в яких межах коливається дане значення у всій генеральній сукупності.
За даними табл. 14 визначаємо, що на перетинанні горизонтального рядка з числом 65 з вертикальною другою графою з числом 200, знаходиться число 6,8. Це означає, що частка засуджених, що вчинили тяжкі насильницькі злочини в стані сп'яніння, може коливатися в межах від 58,2 % до 71,8 % (65% 6,8 %).
Таблиця 14 дає можливість відповісти на запитання, яке мінімальне число одиниць сукупності необхідно включити до вибіркової сукупності, щоб очікуваний результат похибки репрезентативності коливався у встановлених межах.
Найважливіше завдання при проведенні вибіркового дослідження правових явищ – це визначення репрезентативного обсягу вибіркового спостереження, тобто скільки необхідно проаналізувати одиниць з генеральної сукупності, щоб одержана випадкова похибка середнього значення досліджуваної ознаки не перевершувала визначеної величини похибки репрезентативності з достатньою імовірністю.
Спираючись на математичні теореми закону великих чисел, можна встановити, що при зменшенні обсягу вибірки в декілька квадратів разів похибка середнього значення збільшується в стільки ж разів, і навпаки, зменшення похибки середнього значення вибірки в декілька разів призводить до збільшення обсягу вибірки в стільки ж квадратів разів. Отже, визначення величини похибки середнього значення ознаки для встановлення обсягу вибірки має велике значення.
При практичному застосуванні формул дослідник завжди зустрічається з тим, що необхідні дані про коливання ознаки в генеральній сукупності. Як правило, на практиці для визначення обсягу вибірки прибігають до даних попередніх досліджень або проводять так звані пробні обстеження і на їх основі визначають орієнтовні розміри коливання ознаки.
Взагалі слід пам'ятати, що головне при організації вибіркового спостереження – це доведення обсягу його до допустимого мінімуму. При цьому не слід прагнути до надмірного зменшення меж похибки вибірки, тому що це може призвести до невиправданого збільшення обсягу вибірки і, отже, до підвищення витрат на проведення вибіркового спостереження. В той же час не можна і надмірно збільшувати розмір похибки репрезентативності, тому що в цьому випадку хоча і відбудеться зменшення обсягу вибіркової сукупності, але це призведе до погіршення достовірності одержаних результатів.
Таблиця 15
Обсяг вибіркової сукупності при заданій похибки репрезентативності
Наведемо приклад визначення чисельності вибірки на основі табл. 15. Припустимо, що величина досліджуваного показника дорівнює 40 % (частка (питома вага) тяжких злочинів в області), а похибка репрезентативності, яку вважаємо допустимою при даному дослідженні, не повинна бути більш 4 %. По табл. 15 визначаємо, що мінімальний обсяг вибіркової сукупності повинен скласти 600. Отже, щоб наше вибіркове дослідження було репрезентативним з довірчою імовірністю в 95,4 % за наших вихідних даних, нам необхідно обстежити мінімум 600 чоловік засуджених.
Якщо таблиці 14 і 15 відсутні, то в цьому випадку обсяг вибіркової сукупності обчислюється на базі раніш наведеної формули шляхом нескладного її перетворення. Формула для встановлення обсягу вибіркової сукупності буде мати вигляд:
,
де: n – обсяг вибіркової сукупності; w – частина одиниць, які мають дану ознаку; t – коефіцієнт; ? – похибка репрезентативності.
Наприклад, у вибіркову сукупність необхідно взяти 470 – 500 одиниць, щоб із імовірністю 95,4% можна було стверджувати, що похибка репрезентативності при обчисленні частки сукупності не буде відхилятися більше, ніж на ± 4%, якщо відомо, що значення частки у сукупності досягає 25%, тобто за вищенаведеною формулою: .
У більшості випадків при вибіркових дослідженнях дані аналізуються і збирають не по одному, а по декількох ознаках одночасно. У цьому випадку необхідний обсяг вибіркової сукупності визначається по кожній з цих ознак, а потім приймається для дослідження максимальна величина по одній з найбільш істотних ознак.
При наявності якісної сукупності альтернативних ознак (подія може або наступити, або не наступити), якщо не відома реальна величина коливання ознаки, то його величина приймається рівнозначній 50%. (Більш детально це відображено в розділі УШ).
< Попередня Наступна >