Головне меню
Головна Підручники Правова статистика ПРАВОВА СТАТИСТИКА § 4. Показники варіації та способи їх обчислення

§ 4. Показники варіації та способи їх обчислення

Правова статистика - ПРАВОВА СТАТИСТИКА
119

§ 4. Показники варіації та способи їх обчислення

Середні величини мають велике теоретичне і практичне значення, ос­кільки вони дають змогу однією величиною охарактеризувати сукупність од­нотипних явищ. Проте для всебічної характеристики таких явищ їх не дос­татньо. Статистичній сукупності притаманні коливання у кожної окремої одиниці, які у математиці називаються варіацією. Ці коливання обумовлені тим, що статистичні сукупності виникають та існують під впливом багатьох взаємопов`язаних причин. Деякі автори вважають, що на злочинність впливають від 230 до 250 різних факторів.

Причини, які впливають на суспільні явища, можуть бути основними та другорядними. З точки зору діалектики основні причини формують сукуп­ність і впливають на середні показники, а також на знаходження центру роз­поділу. Другорядні причини обумовлюють варіацію ознак, сумісну їх дію, напрямки розвитку явища.

Істотним при цьому є те, що повністю дати оцінку явищу за допомогою тільки середніх показників неможливо: коливання окремих ознак в різних сукупностях можуть бути значними і незначними, а середні величини при цьому будуть однакові. Для підтвердження цієї тези наведемо дані про розподіл засуджених за двома різними складами злочинної діяльності за строками позбавлення волі (табл. 11).

Таблиця 11

Розподіл засуджених за строками позбавлення волі за двома складами злочинної діяльності

В обох прикладах ми взяли по 100 осіб засуджених. В кожному з них се­редній строк позбавлення волі, який обчислено за середньою арифметичною зваженою, має однакове значення, котре дорівнює 6 рокам (600 : 100). Однак, навіть на перший погляд видно, що сукупності є різними. В першій сукуп­ності більшість осіб дійсно одержала середній с

трок позбавлення волі, в дру­гій – навпаки, більшість осіб одержала мінімальні та максимальні строки позбавлення волі за цим складом злочинів.

Щоб встановити, як відрізняються наведені сукупності, а також які межі коливання має ознака, необхідно обчислити такі показники варіації: розмах варіації, середнє лінійне відхилення, середнє квадратичне відхилення і коефіцієнт варіації. Кожний з цих показників має певні аналітичні переваги при вирішенні тих чи інших завдань статистичного аналізу.

Розмах варіації – це різниця між найбільшим і найменшим значеннями ознаки у сукупності. Залежно від того, в якому вигляді наведені первинні дані, техніка обчислення цього показника різна: це може бути різниця між верхньою межею останнього інтервалу і нижньою межею першого інтервалу або різниця між середніми значеннями цих інтервалів. Обраховується за формулою:

R = xmax – xmin ,

де: R – розмах варіації; xmax – найбільше значення ознаки в сукупності; xmin – найменше значення ознаки в сукупності.

За даними табл. 11 в першому прикладі розмах варіації склав 10 років (11 – 1), а в другому – 6 років (9 – 3).

Розмах варіації відображає тільки крайні значення ознаки, тому він є го­ловним показником у тих випадках, коли варіанти повторюються один раз. В інших випадках розмах варіації застосовується для того, щоб одержати за­гальне уявлення про варіацію ознаки у всієї сукупності. Наприклад, розмах варіації віку у студентів різних форм навчання має бути різним, але він завж­ди буде меншим за розмах варіації віку всього населення певного регіону. В деяких регіонах він може бути більше 100 років.

Безумовною перевагою цього показника, як міри оцінки коливання оз­наки, можна вважати нескладність його обчислення і розуміння. Але його не­доліком є те, що він оцінує лише крайні коливання ознаки, а вони можуть бу­ти для сукупності випадковими і зовсім не відображати розподіл відхилення ознаки в сукупності. У зв`язку з цим, надійність даного показника є невисо­кою, але його часто використовують для попередньої оцінки варіації при ста­тистичних розрахунках.

Так, в першому прикладі 60 % осіб засуджені на строк, який збігається з середнім строком позбавлення волі; в другому – їх лише 20 %, але розмах ва­ріації в другому прикладі менший, ніж в першому, що не відповідає ні логіці, ні дійсності.

За даними табл. 9 розмах варіації дорівнює 4 особам (5 – 1); за даними, які застосовані для розрахунку медіани, – 20 рокам (35 – 15). Це ще раз підт­верджує висновок про те, що розмах варіації істотно залежить від значень ознаки і дає лише приблизну характеристику наявності коливань ознаки в су­купності.

Для характеристики реального розподілу відхилень окремих значень одиниць сукупності від середньої величини застосовуються середнє лінійне та середнє квадратичне відхилення.

Середнє лінійне відхилення – це арифметична середня з абсолютних значень відхилень ознаки окремих варіантів від їх середньої арифметичної. Середнє лінійне відхилення обчислюється за формулою:

,

де: ? – середнє лінійне відхилення; x – значення ознаки; – середнє значення ознаки; f – частота (вага) кожного варіанта.

При обчисленні цього показника відхилення від середньої величини однаково оцінюються як в більший, так і менший бік. Це є не зовсім вірним з точки зору економічного аналізу, тому що нас завжди цікавлять зрушення і зміни в сукупності в якійсь-то один бік і ми дуже обережно ставимося до змін в іншій бік. Наприклад, незначні строки покарання свідчать про те, що особами вчинено менше тяжких злочинів.

У табл. 12 наведений розрахунок середнього лінійного та середнього квадратичного відхилень.

Таблиця 12.

Розрахунок середнього лінійного та середнього квадратичного відхилень

На підставі даних, які наведені в табл. 12, видно, що для обчислення се­реднього лінійного відхилення слід брати абсолютне значення показників. Якщо підсумувати усі значення з урахування знаку, то в четвертому та де­в`ятому стовпчиках табл. 12 одержимо нуль. З точки зору математики одер­жання нуля є обов`язковим, які б первинні дані ми не мали. Для статистики нульовий результат немає сенсу.

Обчислимо за даними табл. 12 середнє лінійне відхилення для першого прикладу – 1,1 роки (підсумуємо усі дані, наведені в четвертому стовпчику, незважаючи на знак перед числом, тобто 25 + 30 + 0 + 30 + 25, цю суму слід поділити на загальну кількість засуджених осіб, на 100 чоловік); для другого прикладу – 2,0 роки ((90 + 10 + 0 +10 +90) : 100), за даними, які наведені у де­в`ятому стовпчику. Одержані дані характеризують, що друга сукупність має більші коливання, ніж перша.

Найчастіше при економічних розрахунках для оцінки щільності взаємо­зв`язку явищ, обчислення похибки репрезентативності тощо використову­ється середнє квадратичне відхилення.

Середнє квадратичне відхилення – це корінь квадратний із середньо­го квадрату відхилень ознаки кожного варіанту від їх середньої арифметич­ної. Цей показник обчислюється за такою формулою:

,

де: ? – середнє квадратичне відхилення; x – значення ознаки; – середнє значення ознаки.

Щоб його знайти, достатньо суму п`ятого і десятого стовпчиків табл. 12 поділити на загальну кількість показників і з одержаної величини добути корінь квадратний.

Середнє квадратичне відхилення в першому прикладі дорівнює 1,92 ро­кам (370 ділимо на 100 і добуваємо корінь квадратний), в другому прикладі – 2,37 рокам. Отже, середнє квадратичне відхилення дає змогу встановити, що друга сукупність (другий приклад) має значно більші коливання ознак – в 1,23 рази ( 2.37 : 1.92).

Усі наведені показники (розмах варіації, середнє лінійне і середнє квад­ратичне відхилення) дають змогу встановити і оцінити міру коливання ознак в абсолютному розмірі, тому всі вони обов`язково мають точно такі ж оди­ниці виміру, як і одиниці сукупності. Для роз`яснення техніки обчислення показників варіації і були взяті дві однакові з точки зору одиниць виміру су­купності, тому їх можна і порівнювати між собою.

Недоліком середнього квадратичного відхилення є те, що воно характе­ризує тільки абсолютну міру коливання ознаки. Якщо обчислювати середнє квадратичне відхилення за даними табл. 9, то можна одержати показник 1,28 чол. В цьому разі порівнювати його з показниками наших прикладів не можна.

Між середнім лінійним, середньо величиною і середнім квадратичним відхиленням існує такий зв`язок 1,25 ? = ?, а ? = 1/3 . В симетричних рядах розподілу середнє квадратичне відхилення можна визначити за формулою: ? = 1/6 (xmax – xmin), або ж ? = 1/6 R.

Розрахунок середнього квадратичного відхилення має логічний зміст ли­ше в тому випадку, коли фактичний розподіл ознаки близький до нормаль­ного. Для явно асиметричних розподілень його розрахунок не має сенсу.

Квадрат середнього відхилення має назву дисперсії. Значення цього по­казника істотно зростає, коли нам необхідно обчислити варіацію альтерна­тивної ознаки. Як вже підкреслювалось, альтернативна ознака – це така, яку кожна одиниця сукупності або має, або не має. Наприклад, наявність вченого ступеню у викладачів вищого учбового закладу.

Кількісно варіація альтернативної ознаки виражається двома значення­ми: наявність ознаки позначається через одиницю, а її відсутність – нуль. По­значивши частку одиниць, які мають дану ознаку через р, а одиниці, які не мають цієї ознаки через q = (1 – р), визначимо середню арифметичну альтер­нативної ознаки. Вона буде дорівнювати:

.

Після цього обчислимо дисперсію альтернативної ознаки:

Отже частка для альтернативної ознаки замінює середню величину, а дисперсія є добутком частки на доповнення її до одиниці. Значення дисперсії альтернативної ознаки та її максимального значення необхідне для обчислен­ня похибки репрезентативності при вибірковому спостереженні (розділ ІХ підручника).

Для більш детальної характеристики сукупності застосовується віднос­ний показник – коефіцієнт варіації. Існують різні думки щодо того, за яким з показників його можна обчислювати. На практиці завжди порівнюють за допомогою середнього квадратичного відхилення, яке найбільш реалістично відображає коливання ознаки в сукупності.

Коефіцієнт варіації – це відсоткове відношення середнього квадратич­ного відхилення до середнього рівня. Як правило, цей середній рівень обчис­люється за формулою середньої арифметичної. Коефіцієнт варіації обчислю­ється за формулою:

,

де: V – коефіцієнт варіації; – середнє квадратичне відхилення; – середній розмір ознаки в статистичній сукупності.

За даними табл. 12 коефіцієнт варіації в першому прикладі дорівнює 32,0 % ( 1,92 : 6 х 100), в другому прикладі – 39,5 % (2,37 : 6 х 100); за даними табл. 9 – 53,3 % (1,28 : 2,4 х 100).

Коефіцієнт варіації дає змогу порівняти різні сукупності. Чим менше цей показник, тим менше коливання ознаки в сукупності і тим більш однорідна сукупність, і навпаки.

Показник коефіцієнта варіації слід використовувати для оцінки однорід­ності сукупності. Існує оціночний критерій – сукупність однорідна і середня величина в ній є типовою, якщо коефіцієнт варіації не перевищує 33 %. Та­ким чином, тільки сукупність, яка наведена в першому прикладі, є однорід­ною, хоча в ній розмах варіації був значно більшим, ніж в інших сукуп­но­стях.

Розрізняють такі значення відносних коливань (варіації)

незначну ознаку V ? 10 %

середню V = 10,1 – 30 %.

велику V > 30 %.

При розрахунку коефіцієнта варіації ознаки у різних сукупностях та умовах виникає необхідність його оцінки. Наприклад, якщо вивчають кіль­кість справ, розглянутих суддями різних місцевих судів за визначений період (місяць, рік), кількість осіб засуджених повторно у різних виправних устано­вах тощо, то істотність різниці коефіцієнтів варіації розраховують за формулою:

tф =  

Різницю коефіцієнтів варіації вважають невипадковою, якщо критерій згоди tф › 3, якщо ж tф ‹ 3, роблять висновок, що при цій кількості спостережень нульова гіпотеза не підтверджується, і тому істотна різниця не доведена.

 

< Попередня   Наступна >