§ 4. Показники варіації та способи їх обчислення
Правова статистика - ПРАВОВА СТАТИСТИКА |
§ 4. Показники варіації та способи їх обчислення
Середні величини мають велике теоретичне і практичне значення, оскільки вони дають змогу однією величиною охарактеризувати сукупність однотипних явищ. Проте для всебічної характеристики таких явищ їх не достатньо. Статистичній сукупності притаманні коливання у кожної окремої одиниці, які у математиці називаються варіацією. Ці коливання обумовлені тим, що статистичні сукупності виникають та існують під впливом багатьох взаємопов`язаних причин. Деякі автори вважають, що на злочинність впливають від 230 до 250 різних факторів.
Причини, які впливають на суспільні явища, можуть бути основними та другорядними. З точки зору діалектики основні причини формують сукупність і впливають на середні показники, а також на знаходження центру розподілу. Другорядні причини обумовлюють варіацію ознак, сумісну їх дію, напрямки розвитку явища.
Істотним при цьому є те, що повністю дати оцінку явищу за допомогою тільки середніх показників неможливо: коливання окремих ознак в різних сукупностях можуть бути значними і незначними, а середні величини при цьому будуть однакові. Для підтвердження цієї тези наведемо дані про розподіл засуджених за двома різними складами злочинної діяльності за строками позбавлення волі (табл. 11).
Таблиця 11
Розподіл засуджених за строками позбавлення волі за двома складами злочинної діяльності
В обох прикладах ми взяли по 100 осіб засуджених. В кожному з них середній строк позбавлення волі, який обчислено за середньою арифметичною зваженою, має однакове значення, котре дорівнює 6 рокам (600 : 100). Однак, навіть на перший погляд видно, що сукупності є різними. В першій сукупності більшість осіб дійсно одержала середній с
Щоб встановити, як відрізняються наведені сукупності, а також які межі коливання має ознака, необхідно обчислити такі показники варіації: розмах варіації, середнє лінійне відхилення, середнє квадратичне відхилення і коефіцієнт варіації. Кожний з цих показників має певні аналітичні переваги при вирішенні тих чи інших завдань статистичного аналізу.
Розмах варіації – це різниця між найбільшим і найменшим значеннями ознаки у сукупності. Залежно від того, в якому вигляді наведені первинні дані, техніка обчислення цього показника різна: це може бути різниця між верхньою межею останнього інтервалу і нижньою межею першого інтервалу або різниця між середніми значеннями цих інтервалів. Обраховується за формулою:
R = xmax – xmin ,
де: R – розмах варіації; xmax – найбільше значення ознаки в сукупності; xmin – найменше значення ознаки в сукупності.
За даними табл. 11 в першому прикладі розмах варіації склав 10 років (11 – 1), а в другому – 6 років (9 – 3).
Розмах варіації відображає тільки крайні значення ознаки, тому він є головним показником у тих випадках, коли варіанти повторюються один раз. В інших випадках розмах варіації застосовується для того, щоб одержати загальне уявлення про варіацію ознаки у всієї сукупності. Наприклад, розмах варіації віку у студентів різних форм навчання має бути різним, але він завжди буде меншим за розмах варіації віку всього населення певного регіону. В деяких регіонах він може бути більше 100 років.
Безумовною перевагою цього показника, як міри оцінки коливання ознаки, можна вважати нескладність його обчислення і розуміння. Але його недоліком є те, що він оцінує лише крайні коливання ознаки, а вони можуть бути для сукупності випадковими і зовсім не відображати розподіл відхилення ознаки в сукупності. У зв`язку з цим, надійність даного показника є невисокою, але його часто використовують для попередньої оцінки варіації при статистичних розрахунках.
Так, в першому прикладі 60 % осіб засуджені на строк, який збігається з середнім строком позбавлення волі; в другому – їх лише 20 %, але розмах варіації в другому прикладі менший, ніж в першому, що не відповідає ні логіці, ні дійсності.
За даними табл. 9 розмах варіації дорівнює 4 особам (5 – 1); за даними, які застосовані для розрахунку медіани, – 20 рокам (35 – 15). Це ще раз підтверджує висновок про те, що розмах варіації істотно залежить від значень ознаки і дає лише приблизну характеристику наявності коливань ознаки в сукупності.
Для характеристики реального розподілу відхилень окремих значень одиниць сукупності від середньої величини застосовуються середнє лінійне та середнє квадратичне відхилення.
Середнє лінійне відхилення – це арифметична середня з абсолютних значень відхилень ознаки окремих варіантів від їх середньої арифметичної. Середнє лінійне відхилення обчислюється за формулою:
,
де: ? – середнє лінійне відхилення; x – значення ознаки; – середнє значення ознаки; f – частота (вага) кожного варіанта.
При обчисленні цього показника відхилення від середньої величини однаково оцінюються як в більший, так і менший бік. Це є не зовсім вірним з точки зору економічного аналізу, тому що нас завжди цікавлять зрушення і зміни в сукупності в якійсь-то один бік і ми дуже обережно ставимося до змін в іншій бік. Наприклад, незначні строки покарання свідчать про те, що особами вчинено менше тяжких злочинів.
У табл. 12 наведений розрахунок середнього лінійного та середнього квадратичного відхилень.
Таблиця 12.
Розрахунок середнього лінійного та середнього квадратичного відхилень
На підставі даних, які наведені в табл. 12, видно, що для обчислення середнього лінійного відхилення слід брати абсолютне значення показників. Якщо підсумувати усі значення з урахування знаку, то в четвертому та дев`ятому стовпчиках табл. 12 одержимо нуль. З точки зору математики одержання нуля є обов`язковим, які б первинні дані ми не мали. Для статистики нульовий результат немає сенсу.
Обчислимо за даними табл. 12 середнє лінійне відхилення для першого прикладу – 1,1 роки (підсумуємо усі дані, наведені в четвертому стовпчику, незважаючи на знак перед числом, тобто 25 + 30 + 0 + 30 + 25, цю суму слід поділити на загальну кількість засуджених осіб, на 100 чоловік); для другого прикладу – 2,0 роки ((90 + 10 + 0 +10 +90) : 100), за даними, які наведені у дев`ятому стовпчику. Одержані дані характеризують, що друга сукупність має більші коливання, ніж перша.
Найчастіше при економічних розрахунках для оцінки щільності взаємозв`язку явищ, обчислення похибки репрезентативності тощо використовується середнє квадратичне відхилення.
Середнє квадратичне відхилення – це корінь квадратний із середнього квадрату відхилень ознаки кожного варіанту від їх середньої арифметичної. Цей показник обчислюється за такою формулою:
,
де: ? – середнє квадратичне відхилення; x – значення ознаки; – середнє значення ознаки.
Щоб його знайти, достатньо суму п`ятого і десятого стовпчиків табл. 12 поділити на загальну кількість показників і з одержаної величини добути корінь квадратний.
Середнє квадратичне відхилення в першому прикладі дорівнює 1,92 рокам (370 ділимо на 100 і добуваємо корінь квадратний), в другому прикладі – 2,37 рокам. Отже, середнє квадратичне відхилення дає змогу встановити, що друга сукупність (другий приклад) має значно більші коливання ознак – в 1,23 рази ( 2.37 : 1.92).
Усі наведені показники (розмах варіації, середнє лінійне і середнє квадратичне відхилення) дають змогу встановити і оцінити міру коливання ознак в абсолютному розмірі, тому всі вони обов`язково мають точно такі ж одиниці виміру, як і одиниці сукупності. Для роз`яснення техніки обчислення показників варіації і були взяті дві однакові з точки зору одиниць виміру сукупності, тому їх можна і порівнювати між собою.
Недоліком середнього квадратичного відхилення є те, що воно характеризує тільки абсолютну міру коливання ознаки. Якщо обчислювати середнє квадратичне відхилення за даними табл. 9, то можна одержати показник 1,28 чол. В цьому разі порівнювати його з показниками наших прикладів не можна.
Між середнім лінійним, середньо величиною і середнім квадратичним відхиленням існує такий зв`язок 1,25 ? = ?, а ? = 1/3 . В симетричних рядах розподілу середнє квадратичне відхилення можна визначити за формулою: ? = 1/6 (xmax – xmin), або ж ? = 1/6 R.
Розрахунок середнього квадратичного відхилення має логічний зміст лише в тому випадку, коли фактичний розподіл ознаки близький до нормального. Для явно асиметричних розподілень його розрахунок не має сенсу.
Квадрат середнього відхилення має назву дисперсії. Значення цього показника істотно зростає, коли нам необхідно обчислити варіацію альтернативної ознаки. Як вже підкреслювалось, альтернативна ознака – це така, яку кожна одиниця сукупності або має, або не має. Наприклад, наявність вченого ступеню у викладачів вищого учбового закладу.
Кількісно варіація альтернативної ознаки виражається двома значеннями: наявність ознаки позначається через одиницю, а її відсутність – нуль. Позначивши частку одиниць, які мають дану ознаку через р, а одиниці, які не мають цієї ознаки через q = (1 – р), визначимо середню арифметичну альтернативної ознаки. Вона буде дорівнювати:
.
Після цього обчислимо дисперсію альтернативної ознаки:
Отже частка для альтернативної ознаки замінює середню величину, а дисперсія є добутком частки на доповнення її до одиниці. Значення дисперсії альтернативної ознаки та її максимального значення необхідне для обчислення похибки репрезентативності при вибірковому спостереженні (розділ ІХ підручника).
Для більш детальної характеристики сукупності застосовується відносний показник – коефіцієнт варіації. Існують різні думки щодо того, за яким з показників його можна обчислювати. На практиці завжди порівнюють за допомогою середнього квадратичного відхилення, яке найбільш реалістично відображає коливання ознаки в сукупності.
Коефіцієнт варіації – це відсоткове відношення середнього квадратичного відхилення до середнього рівня. Як правило, цей середній рівень обчислюється за формулою середньої арифметичної. Коефіцієнт варіації обчислюється за формулою:
,
де: V – коефіцієнт варіації; – середнє квадратичне відхилення; – середній розмір ознаки в статистичній сукупності.
За даними табл. 12 коефіцієнт варіації в першому прикладі дорівнює 32,0 % ( 1,92 : 6 х 100), в другому прикладі – 39,5 % (2,37 : 6 х 100); за даними табл. 9 – 53,3 % (1,28 : 2,4 х 100).
Коефіцієнт варіації дає змогу порівняти різні сукупності. Чим менше цей показник, тим менше коливання ознаки в сукупності і тим більш однорідна сукупність, і навпаки.
Показник коефіцієнта варіації слід використовувати для оцінки однорідності сукупності. Існує оціночний критерій – сукупність однорідна і середня величина в ній є типовою, якщо коефіцієнт варіації не перевищує 33 %. Таким чином, тільки сукупність, яка наведена в першому прикладі, є однорідною, хоча в ній розмах варіації був значно більшим, ніж в інших сукупностях.
Розрізняють такі значення відносних коливань (варіації)
незначну ознаку V ? 10 %
середню V = 10,1 – 30 %.
велику V > 30 %.
При розрахунку коефіцієнта варіації ознаки у різних сукупностях та умовах виникає необхідність його оцінки. Наприклад, якщо вивчають кількість справ, розглянутих суддями різних місцевих судів за визначений період (місяць, рік), кількість осіб засуджених повторно у різних виправних установах тощо, то істотність різниці коефіцієнтів варіації розраховують за формулою:
tф =
Різницю коефіцієнтів варіації вважають невипадковою, якщо критерій згоди tф › 3, якщо ж tф ‹ 3, роблять висновок, що при цій кількості спостережень нульова гіпотеза не підтверджується, і тому істотна різниця не доведена.
< Попередня Наступна >