§ 3. Прийоми виявлення щільності зв’язку між показниками досліджуваних явищ
Правова статистика - ПРАВОВА СТАТИСТИКА |
§ 3. Прийоми виявлення щільності зв’язку між показниками досліджуваних явищ
Для вивчення кореляційної залежності, інакше кажучи, для відповіді на запитання про наявність чи відсутність кореляційного зв`язку, застосовують різні методи: балансовий, паралельних рядів, групувань, графічний метод, метод регресійного та дисперсійного аналізу та інші методи математичної статистики.
Балансовий метод. Цей метод широко застосовується в статистиці для вивчення зв'язку і пропорцій в господарстві. Сутність його полягає в тому, що дві суми абсолютних величин пов'язані між собою знаком рівності, наприклад:
Простішим є баланс матеріальних ресурсів. Так, баланс сталі відображує її надходження і за якими напрямкам вона використовується. Таким чином будують баланси чавуну, паливно-енергетичний, багатьох важливіших видів продукції, основних фондів тощо.
Баланси дають змогу проаналізувати виробництво і споживання тих чи інших продуктів, наявність і використання окремих ресурсів.
Більш складнішу схему становить собою шаховий баланс міжрайонних або міжгалузевих зв'язків по вантажообігу, виробничому споживанню продукції тощо. Аналіз таких балансів дозволяє глибоко дослідити закономірності процесу відтворення і спиратися на них при плануванні.
Балансовий метод вивчення взаємозв`язків застосовується дуже часто в економічній статистиці. У правовій статистиці цей метод використовується рідко. Його можна використовувати в практичній діяльності правоохоронних органів лише для побудови балансу руху кримінальних, цивільних або адміністративних справ в правоохоронних органах, органах суду.
Метод порівняння паралельних рядів. Цей метод широко застосовується для встановлення зв'язку
Наявність великої кількості різних значень результативної ознаки ускладнює сприйняття таких паралельних рядів, особливо за наявністю значної кількості одиниць, які складають статистичну сукупність. В цьому випадку доцільно для встановлення факту наявності або відсутності зв`язку використовувати групові таблиці.
Паралельні ряди можна порівнювати як в статиці, тобто за один і той же час порівняння, так і в динаміці, порівнювати дані за окремі хронологічні періоди. Якщо порівнювати ряди динаміки однойменних показників на різних територіях, то можна порівнювати не тільки абсолютні прирости і темпи зростання, а й рівні на однакові дати, щоб одержати відповідь на запитання, наскільки рівень одного ряду більше або менше іншого. Можна порівнювати ряди динаміки середніх і відносних величин, що робить статистичний аналіз більш глибоким та всебічним.
Ряди розподілу можна використовувати для порівняння розподілу усього населення і осіб, які вчинили злочини, за віком, статтю, соціальним, родинним станом тощо. При цьому порівнянні можна встановити наскільки часто, за той чи інший проміжок часу зустрічається та чи інша група серед осіб, які вчинили злочини, ніж серед усього населення.
Краще порівнювати ряди динаміки, ніж ряди розподілу. При порівняльному аналізі рядів динаміки з метою наочного встановлення взаємозалежності між явищами доцільно привести ряди до однієї основи, до загальної бази порівняння. За загальну базу порівняння може бути прийнято не тільки який-небудь безпосередній рівень ряду, а й середній рівень. Приводити ряди динаміки до однієї основи треба тоді, коли ряди характеризують динаміку різних, безпосередньо не сумісних, але взаємопов`язаних рядів. Цей метод використовується в статистичній практиці для виявлення щільності між показниками досліджуваних явищ. За допомогою цього методу можна аналізувати однойменні дані, які відносяться до різних територій, наприклад, порівнювати динаміку коефіцієнта злочинності в різних країнах за певний проміжок часу.
Інколи виникає запитання: в яких випадках при вивченні паралельних рядів можна порівнювати їх рівні по відношенню до базисного (початкового) рівня, а в яких – до середнього рівня? У загальній теорії статистики існує така точка зору: якщо ряд динаміки має сталу тенденцію до зростання або зменшення, то лише тоді його треба порівнювати по відношенню до базисного рівня. У правовій статистиці краще порівнювати рівні паралельних рядів по відношенню до базисного рівня без урахування тенденцій зміни того чи іншого явища.
Цей метод вивчення взаємозв’язків між явищами може застосовуватися і у правовій статистиці. Можна, наприклад, порівнювати ряди про кількість засуджених за хуліганство і про кількість спожитого алкоголю на 100 тис. населення по окремих районах, містах або за окремі роки; кількість вчинених злочинів, кількість осіб, які вчинили злочини, і кількість засуджених. У цивільно-правовій статистиці можна порівнювати ряди кількості побудованого житла і інтенсивності житлових спорів (на 10 тис. населення); кількості зареєстрованих шлюбів і розлучень на 10 тис. населення по окремих районах або за окремі періоди тощо.
Проаналізуємо за допомогою паралельних рядів, чи стають більш молодими злочинці в районі міста за декілька років. Молодими у кримінально-правовій статистиці вважаються особи до 30 років (табл. 23).
Таблиця 23.
Дані про кількість зареєстрованих злочинів в районі міста.
Абсолютні і відносні дані, які наведені в табл. 23, не дають змоги встановити наявність чи відсутність тенденції про вчинення злочинів у віці до 30 років. З метою встановлення чи відсутності такої залежності побудуємо паралельні ряди, які охарактеризують зміну питомої ваги осіб до 30 років. Усі дані братимемо по відношенню до 1998 р., тому що він є початковим. Розрахунок показників наведемо в таблиці 24.
Таблиця 24.
Дані про зміну злочинності в районі міста (в % до 1998 року).
Тільки обчисливши усі дані по відношенню до 1998 року, можна побачити, що дійсно відбувалося в районі міста “омолодження” злочинності (третій рядок таблиці 24). Даний числовий приклад дає змогу зрозуміти можливість застосування паралельних рядів для статистичного аналізу і складність його використання. При цьому шляхом попереднього теоретичного аналізу слід з`ясувати наявність залежності між показниками і за якими критеріями його можна оцінити.
Метод статистичних групувань. Цей метод у порівнянні з методом середніх та відносних величин має велике значення для вивчення взаємозв’язку між явищами суспільного життя.
Щоб вивчити взаємозв’язок з допомогою методу групувань, необхідно розгрупувати всі одиниці за ознакою, вплив якої треба визначити, і в межах кожної групи обчислити середню величину іншої ознаки, залежної від групувальної ознаки(результативної). Порівнюючи середні значення похідної (результативної) ознаки з ознакою, яка покладена в основу групування, встановлюємо зв'язок між ознаками. Отже, поєднання методу групувань з методом середніх дає змогу обчислити групові середні, які використовуються для вимірювання взаємозалежності явищ.
При визначенні залежності будь-якої ознаки не від однієї, а від декількох ознак, треба провести групування за цими ознаками, взятими в сукупності, тобто в комбінації. На базі цього групування слід побудувати комбінаційну таблицю, в підметі якої будуть групи і підгрупи, утворені за кількома ознаками, взятими в комбінації, а в присудку – середні розміри ознаки, обумовлені групувальними ознаками.
За допомогою таких групувань можна вивчити зв`язок між злочинністю і “фоновими” явищами (алкоголізмом, наркоманією, розпутством тощо), між злочинністю неповнолітніх та їх сімейно-побутовими умовами життя, між злочинністю і рівнем освіти осіб, які вчинили злочини, і т.п. Цей метод дає змогу встановити наявність чи відсутність зв`язку між явищами, а також загальну тенденцію цієї залежності. Для проведення таких групувань є достатньо даних в статистичній звітності правоохоронних органів.
Наприклад, ми маємо такі дані про роботу 15 суддів місцевого суду (табл. 25).
Таблиця 25.
Відомості про кількість розглянутих справ і якість їх розгляду.
Використовуючи метод групування, розіб’ємо усі дані на п`ять груп з рівними інтервалами. Для цього від максимальної кількості розглянутих справ (201 справа) віднімемо мінімальну кількість розглянутих справ (26 справ) і одержаний результат поділимо на 5. Інтервали дорівнюватимуть 35 справам. Після цього шляхом нескладних арифметичних розрахунків одержимо такі дані, які будуть наглядно свідчити про залежність якості розгляду справ від завантаженості суддів. Зростання кількості розглянутих справ призводить до зниження якості судочинства і, як наслідок, до зростання питомої ваги скасованих вироків (табл. 26).
Таблиця 26.
Залежність якості судочинства від завантаженості суддів.
Метод групувань, як й інші методи, дає змогу встановити наявність чи відсутність залежності між явищами, а також встановити загальний напрямок цієї залежності.
За допомогою статистичних групувань можна встановити вплив двох і більше факторів на зміну результативної ознаки (комбінаційні групування). Групування важливі і для вивчення зв'язків між якісними та кількісними показниками. Але метод групувань та інші розглянуті методи не дають змоги і не ставлять своїм завданням числове вираження щільності зв'язку. Це питання розв’язується в статистиці лише за допомогою методів кореляції, розроблених математичною статистикою.
Графічний метод. Він використовується для попереднього встановлення наявності зв`язку між явищами та розкриття характеру цього зв’язку, а також для вибору форми зв`язку. У статистиці його застосовують таким чином, на прямокутній системі координат наносяться індивідуальні значення ознаки (факторної) і відповідних йому значень результативної у вигляді окремих точок (див. рис. 18). На даному рисунку нанесені одночасно вік злочинців і кількість вчинених ними фактів хуліганства в окремих районах міста. Для умовного приклада ми взяли чотири райвідділи міста. Як видно з графіку, ця залежність є оберненою, чим старше злочинці, тим менше фактів хуліганства вони вчиняють . (Приклад умовний, дані наведені в табл. 27).
Таблиця 27.
Дані про кількість виявлених осіб, які вчинили хуліганство.
Рис. 18. Залежність кількості виявлених хуліганств від віку осіб, які їх вчинили.
З графіку (рис. 18) видно, що точки кореляційного поля лежать ні на одній лінії, вони витягнуті смугою зліва направо. Можна згрупувати ці дані по кожній віковій групі і знайти середні значення. (останній рядок табл. 27). Після цього нанести ці середні значення на графік і з`єднуючи їх послідовно відрізками прямих ліній , побудувати так звану емпіричну лінію зв`язку (на графіку 18 – перервна лінія).
Якщо ця емпірична лінія зв`язку по вигляду наближається до прямої лінії, то можна припустити наявність прямолінійної кореляційної залежності між факторною та результативною ознаками. На графіку 18 вона побудована, як лінія неперервна. Якщо ж є тенденція нерівномірної зміни значень результативної ознаки, і емпірична крива наближується до якої-небудь кривої, то це може бути пов`язано з наявністю криволінійної кореляційної залежності.
Регресійний та дисперсійний метод аналізу зв'язків. Цей метод покликаний вирішити три основних завдання:
1) в результаті економічного аналізу встановити форму зв'язку і дати його математичне вираження за допомогою кореляційних рівнянь;
2) встановити щільність зв'язку між факторною (х) і результативною ознакою (у);
3) встановити ті фактори, які в даних конкретних умовах є головними щодо формування результативного фактору.
Перше завдання вирішується в ході аналізу того чи іншого явища. Залежно від форми зв’язку, який визначено на основі попереднього якісного аналізу, кореляційні рівняння можуть мати різний вигляд. У статистиці використовуються прямолінійні та криволінійні кореляційні рівняння.
Теоретичної лінією регресії називають ту лінію, навколо якої групуються точки кореляційного поля і яка вказує основний напрямок, основну тенденцію зв`язку. Теоретична лінія регресії повинна відображувати зміни середніх величин результативної ознаки ух відповідно до зміни факторної ознаки х.
Якщо попередній аналіз явищ, зв’язок між якими вивчається, показує, що рівним змінам середніх значень факторної ознаки відповідають приблизно рівні зміни середніх значень результативної ознаки, то для вираження форми кореляційного зв’язку можна використати прямолінійне кореляційне рівняння:
ух = а0 + а1х,
де ух – ординати шуканої прямої, або вирівнюванні значення результативної ознаки; х – факторна ознака; а0 і а1 – параметри рівняння.
Перший параметр рівняння а0 – ордината лінії при х = 0. Параметр а1, який називається коефіцієнтом регресії, – це показник середньої зміни ознаки у на одиницю ознаки х в межах даного дослідження.
Якщо ми маємо обернену залежність між результативною та факторною ознакою, то рівняння лінійної залежності буде мати вигляд:
ух = а0 – а1х,.
Така лінія регресії нами побудована на рисунку 18. Її параметри будуть мати вигляд: y = 24,438-0,4978x.
Для знаходження параметрів рівняння а0 і а1 застосовують спосіб найменших квадратів. Цей спосіб полягає в тому, що знаходять такі значення коефіцієнтів рівняння, при яких сума відхилень фактичних значень результативної ознаки від обчислених за допомогою рівняння буде найменша з усіх можливих, тобто сума відхилень точок кореляційного поля від відповідних точок теоретичної лінії регресії дорівнює нулю.
Якщо попередній аналіз досліджуваних явищ, зв'язок між якими вивчається, показує, що рівним змінам середніх значень факторної ознаки відповідають нерівні зміни середніх значень результативної ознаки, то для вираження загального характеру зв'язку застосовують криволінійні форми кореляційних рівнянь, з яких найбільш частіше використовуються вирівнювання за параболою і гіперболою.
Прямолінійне кореляційне рівняння має більш широке застосування, тому що його параметри легше обчислити, хоча в реальному житті лінійний зв'язок між явищами суспільного життя зустрічається дуже рідко. Але якщо вибрати не тривалий термін часу, то яка завгодно крива лінія обов`язково наближується до прямої лінії. Тому вибір прямої лінії можна розглядати як деяке спрощення дійсної залежності між явищами і істотного спрощення усіх розрахунків.
Друге завдання кореляційного аналізу – це вимірювання щільності зв'язку, тобто ступеня впливу х на варіацію ознаки у. Щільність кореляційного зв'язку оцінюється за допомогою коефіцієнта кореляції та кореляційного відношення. Коефіцієнт кореляції – це числова характеристика, що виражає взаємозв'язок і спільний розподіл двох випадкових величин. Він достатньо точно оцінує ступінь щільності взаємозв`язку при наявності лінійної залежності між факторними та результативною ознаками. При наявності криволінійної залежності він недооцінює ступінь щільності зв`язку, тому рекомендується використовувати у якості показника ступеню щільності зв`язку кореляційне відношення. Обчислення кореляційного відношення можливо лише при наявності достатньо великої кількості даних, які наведені, як правило, у вигляді групової таблиці. Обчислення кореляційного відношення при великій кількості груп і малої кількості одиниць у кожній групі позбавлено сенсу.
Індекс кореляції завжди повинен знаходитися в межах від нуля до одиниці. Якщо індекс кореляції дорівнює нулю, то немає ніякого взаємозв`язку між досліджуваними явищами, інакше кажучи, результативна ознака не залежить зовсім від зміни цієї факторної ознаки. Якщо індекс кореляції дорівнює одиниці, то це свідчить про наявність повного, функціонального зв`язку між явищами, про те, що результативна ознака повністю залежить від зміни факторної ознаки.
Чим ближче одержаний результат до одиниці, тим більш щільно результативна ознака залежить від факторної, і навпаки.
Індекс кореляції може мати як знак плюс, так і знак мінус. Якщо залежність між показниками пряма, то індекс кореляції має знак плюс; якщо залежність між показниками обернена, то індекс кореляції матимемо знак мінус.
Оцінити щільність взаємозв`язку можна лише за допомогою законів математичної статистики. З цією метою застосовуються спеціальні таблиці. На практиці для більшості економічних розрахунків вважається, що він обов`язково повинен бути більше 0,75, щоб більше, ніж на три четверті зміна результативної ознаки складалась під впливом факторної.
За прикладом (табл. 27) коефіцієнт кореляції дорівнює -0,97247, тобто на 97,2 % вчинення злочину залежить від віку злочинців. (Умовний приклад). Якщо в дійсності коефіцієнт кореляції має таке значення, то слід мати на увазі, що в цьому випадку можна казати про те, що між показниками існує дуже щільний зв`язок, який наближує його до функціонального.
В юридичній науці була зроблена спроба розробити спеціальний коефіцієнт кореляції між показниками судимості та покарання, але ця формула не знайшла розповсюдження, тому ми її не наводимо.
Обчисливши лінійний коефіцієнт кореляції, оцінюючий ступінь зв`язку між змінами факторної та результативної ознаки, можна обчислити коефіцієнт регресії, що дає змогу вирішити завдання обґрунтованого прогнозу тенденцій зміни результативного фактору в майбутньому. Практичне використання рівнянь регресії з метою екстраполяції можливо лише в тоді, коли, ми вважаємо, що в майбутньому істотно не змінюються умови формування рівнів ознаки, які лежали в основі обчислення параметрів рівняння регресії. Це ще раз підкреслює, що метод екстраполяції на основі рівнянь регресії може застосовуватися на практиці лише на не тривалий термін часу.
Ми зупинилися лише на розгляді питань парної кореляції. В дійсності ж при проведенні статистичного аналізу правових явищ слід вивчати багатофакторні кореляційні взаємозв`язки, тому що в практиці результативний фактор змінюється під впливом декількох причин, факторних ознак. Одночасне вивчення впливу їх провадиться на основі використання методів множинної кореляції. В цьому випадку можна обчислити часткові та множинні коефіцієнти кореляції, які дають змогу встановити вплив різних факторів на зміну результативної ознаки.
Якщо позначити фактори х1, х2, х3, …, хm, то лінійне рівняння множинної кореляційної залежності може бути у загальному вигляді записано таким чином:
ух1, х2, х3, …, хm = b0 + b1 х1+b2 х2 +b3 х3+ …+ bm хm.
По параметрам цього рівняння можна оцінити внесок кожного із факторів на зміну рівня результативного фактору. Коефіцієнти рівняння множинної регресії дають змогу встановити абсолютний розмір впливу факторів на рівень результативної ознаки і характеризують ступінь впливу кожного фактора на результативну ознаку при фіксованому (середньому) рівні інших факторів.
З метою порівняння оцінок ролі різних факторів у формуванні результативної ознаки необхідно доповнити абсолютні показники відносними, такими як коефіцієнт еластичності, бета та дельта-коефіцієнти, які дають змогу уточнити вплив різних факторів на ті чи інші результати. Так, частковий коефіцієнт еластичності показує, на скільки відсотків в середньому змінюється результативна ознаки зі зміною ознаки-фактора (наприклад, першого) на один відсоток при фіксованому стані інших факторів. Бета-коефіцієнт дозволяє порівнювати вплив коливання різних факторів на варіацію результативної ознаки, на основі чого виявляються фактори, в розвитку яких закладені найбільші резерви зміни результативної ознаки. З метою оцінки частки впливу кожного фактора у сумарний їх вплив розраховуються дельта-коефіцієнти. При достатньо значній кількості факторів, які включені до рівняння регресії, проводиться ранжування факторів за величиною цих коефіцієнтів.
Побудова багатофакторних регресійних рівнянь дозволяє дати кількісний опис основних закономірностей досліджуваних явищ, відокремити істотні фактори, які обумовили зміну результативної ознаки, та оцінити їх вплив.
Кореляційний аналіз дозволяє вимірити залежність юридично значущих явищ від інших, встановити взаємозв`язок рівнів попередніх і сучасних періодів часу одного і того ж явища. Цей останній вид кореляційного аналізу має назву авторегресійного або автокореляції.
Можливості широкого застосування методів кореляції в недалекому минулому стримувалося значною трудомісткістю необхідних розрахунків. Сьогодні при застосуванні сучасної обчислювальної техніки – ці обмеження не мають значення. Але роль дослідника при проведенні кореляційного аналізу залишається надзвичайно важливою, як на стадії попередньої підготовки масиву вихідної інформації, так і на стадії інтерпретації одержаних рівнянь регресії та їх практичному застосуванні.
Вивчення цих відносно складних проблем виходить за рамки підручника з правової статистики. Але базова підготовка юристів при необхідності дає змогу опанувати цими методами встановлення кореляційного зв`язку.
< Попередня Наступна >