Головне меню
Головна Підручники Правова статистика ПРАВОВА СТАТИСТИКА § 3. Прийоми виявлення щільності зв’язку між показниками досліджуваних явищ

§ 3. Прийоми виявлення щільності зв’язку між показниками досліджуваних явищ

Правова статистика - ПРАВОВА СТАТИСТИКА
172

§ 3. Прийоми виявлення щільності зв’язку між показниками досліджуваних явищ

Для вивчення кореляційної залежності, інакше кажучи, для відповіді на запитання про наявність чи відсутність кореляційного зв`язку, застосовують різні методи: балансовий, паралельних рядів, групувань, графічний метод, метод регресійного та дисперсійного аналізу та інші методи математичної статистики.

Балансовий метод. Цей метод широко застосовується в статистиці для вивчення зв'язку і пропорцій в господарстві. Сутність його полягає в тому, що дві суми абсолютних величин пов'язані між собою знаком рівності, наприклад:

Простішим є баланс матеріальних ресурсів. Так, баланс сталі відображує її надходження і за якими напрямкам вона використовується. Таким чином будують баланси чавуну, паливно-енергетичний, багатьох важливіших видів продукції, основних фондів тощо.

Баланси дають змогу проаналізувати виробництво і споживання тих чи інших продуктів, наявність і використання окремих ресурсів.

Більш складнішу схему становить собою шаховий баланс міжрайонних або міжгалузевих зв'язків по вантажообігу, виробничому споживанню продукції тощо. Аналіз таких балансів дозволяє глибоко дослідити закономірності процесу відтворення і спиратися на них при плануванні.

Балансовий метод вивчення взаємозв`язків застосовується дуже часто в економічній статистиці. У правовій статистиці цей метод використовується рідко. Його можна використовувати в практичній діяльності правоохоронних органів лише для побудови балансу руху кримінальних, цивільних або адміністративних справ в правоохоронних органах, органах суду.

Метод порівняння паралельних рядів. Цей метод широко застосову­ється для встановлення зв'язку

між явищами, які пов`язані між собою. Сут­ність його полягає в тому, що дані ряду факторної ознаки розміщуються за принципом її зростання, або зменшення, або за якимось іншим принципом, і паралельно наводиться ряд даних результативної ознаки, яка залежить від факторної. Шляхом порівняння наведених рядів виявляються наявність і на­прямок зміни результативної ознаки від зміни факторної ознаки. У тих ви­падках, коли зростання факторної ознаки тягне за собою зростання і величи­ни результативної ознаки, можна казати про наявність прямої кореляційної залежності. Якщо ж із збільшенням факторної ознаки, величина результа­тивної ознаки має тенденцію до зменшення, то можна припустити наявність оберненого зв`язку між ознаками.

Наявність великої кількості різних значень результативної ознаки ус­кладнює сприйняття таких паралельних рядів, особливо за наявністю значної кількості одиниць, які складають статистичну сукупність. В цьому випадку доцільно для встановлення факту наявності або відсутності зв`язку викорис­товувати групові таблиці.

Паралельні ряди можна порівнювати як в статиці, тобто за один і той же час порівняння, так і в динаміці, порівнювати дані за окремі хронологічні пе­ріоди. Якщо порівнювати ряди динаміки однойменних показників на різних територіях, то можна порівнювати не тільки абсолютні прирости і темпи зро­стання, а й рівні на однакові дати, щоб одержати відповідь на запитання, на­скільки рівень одного ряду більше або менше іншого. Можна порівнювати ряди динаміки середніх і відносних величин, що робить статистичний аналіз більш глибоким та всебічним.

Ряди розподілу можна використовувати для порівняння розподілу усього населення і осіб, які вчинили злочини, за віком, статтю, соціальним, родинним станом тощо. При цьому порівнянні можна встановити наскільки часто, за той чи інший проміжок часу зустрічається та чи інша група серед осіб, які вчинили злочини, ніж серед усього населення.

Краще порівнювати ряди динаміки, ніж ряди розподілу. При порівняль­ному аналізі рядів динаміки з метою наочного встановлення взаємозалеж­ності між явищами доцільно привести ряди до однієї основи, до загальної бази порівняння. За загальну базу порівняння може бути прийнято не тільки який-небудь безпосередній рівень ряду, а й середній рівень. Приводити ряди динаміки до однієї основи треба тоді, коли ряди характеризують динаміку різних, безпосередньо не сумісних, але взаємопов`язаних рядів. Цей метод використовується в статистичній практиці для виявлення щільності між по­казниками досліджуваних явищ. За допомогою цього методу можна аналізу­вати однойменні дані, які відносяться до різних територій, наприклад, порів­нювати динаміку коефіцієнта злочинності в різних країнах за певний промі­жок часу.

Інколи виникає запитання: в яких випадках при вивченні паралельних рядів можна порівнювати їх рівні по відношенню до базисного (початкового) рівня, а в яких – до середнього рівня? У загальній теорії статистики існує така точка зору: якщо ряд динаміки має сталу тенденцію до зростання або зменшення, то лише тоді його треба порівнювати по відношенню до базис­ного рівня. У правовій статистиці краще порівнювати рівні паралельних ря­дів по відношенню до базисного рівня без урахування тенденцій зміни того чи іншого явища.

Цей метод вивчення взаємозв’язків між явищами може застосовуватися і у правовій статистиці. Можна, наприклад, порівнювати ряди про кількість за­суджених за хуліганство і про кількість спожитого алкоголю на 100 тис. насе­лення по окремих районах, містах або за окремі роки; кількість вчинених зло­чинів, кількість осіб, які вчинили злочини, і кількість засуджених. У цивіль­но-правовій статистиці можна порівнювати ряди кількості побудованого житла і інтенсивності житлових спорів (на 10 тис. населення); кількості за­реєстрованих шлюбів і розлучень на 10 тис. населення по окремих районах або за окремі періоди тощо.

Проаналізуємо за допомогою паралельних рядів, чи стають більш молодими злочинці в районі міста за декілька років. Молодими у кримінально-правовій статистиці вважаються особи до 30 років (табл. 23).

Таблиця 23.

Дані про кількість зареєстрованих злочинів в районі міста.

Абсолютні і відносні дані, які наведені в табл. 23, не дають змоги встановити наявність чи відсутність тенденції про вчинення злочинів у віці до 30 років. З метою встановлення чи відсутності такої залежності побудує­мо паралельні ряди, які охарактеризують зміну питомої ваги осіб до 30 років. Усі дані братимемо по відношенню до 1998 р., тому що він є початковим. Розрахунок показників наведемо в таблиці 24.

Таблиця 24.

Дані про зміну злочинності в районі міста (в % до 1998 року).

Тільки обчисливши усі дані по відношенню до 1998 року, можна поба­чити, що дійсно відбувалося в районі міста “омолодження” злочинності (тре­тій рядок таблиці 24). Даний числовий приклад дає змогу зрозуміти можли­вість застосування паралельних рядів для статистичного аналізу і складність його використання. При цьому шляхом попереднього теоретичного аналізу слід з`ясувати наявність залежності між показниками і за якими критеріями його можна оцінити.

Метод статистичних групувань. Цей метод у порівнянні з методом середніх та відносних величин має велике значення для вивчення взаємо­зв’язку між явищами суспільного життя.

Щоб вивчити взаємозв’язок з допомогою методу групувань, необхідно розгрупувати всі одиниці за ознакою, вплив якої треба визначити, і в межах кожної групи обчислити середню величину іншої ознаки, залежної від групу­вальної ознаки(результативної). Порівнюючи середні значення похідної (результативної) ознаки з ознакою, яка покладена в основу групування, встановлюємо зв'язок між ознаками. Отже, поєднання методу групувань з методом середніх дає змогу обчислити групові середні, які використовуються для вимірювання взаємозалежності явищ.

При визначенні залежності будь-якої ознаки не від однієї, а від декіль­кох ознак, треба провести групування за цими ознаками, взятими в сукупно­сті, тобто в комбінації. На базі цього групування слід побудувати комбіна­ційну таблицю, в підметі якої будуть групи і підгрупи, утворені за кількома ознаками, взятими в комбінації, а в присудку – середні розміри ознаки, обу­мовлені групувальними ознаками.

За допомогою таких групувань можна вивчити зв`язок між злочинністю і “фоновими” явищами (алкоголізмом, наркоманією, розпутством тощо), між злочинністю неповнолітніх та їх сімейно-побутовими умовами життя, між злочинністю і рівнем освіти осіб, які вчинили злочини, і т.п. Цей метод дає змогу встановити наявність чи відсутність зв`язку між явищами, а також загальну тенденцію цієї залежності. Для проведення таких групувань є достатньо даних в статистичній звітності правоохоронних органів.

Наприклад, ми маємо такі дані про роботу 15 суддів місцевого суду (табл. 25).

Таблиця 25.

Відомості про кількість розглянутих справ і якість їх розгляду.

Використовуючи метод групування, розіб’ємо усі дані на п`ять груп з рівними інтервалами. Для цього від максимальної кількості розглянутих справ (201 справа) віднімемо мінімальну кількість розглянутих справ (26 справ) і одержаний результат поділимо на 5. Інтервали дорівнюватимуть 35 справам. Після цього шляхом нескладних арифметичних розрахунків одер­жимо такі дані, які будуть наглядно свідчити про залежність якості розгляду справ від завантаженості суддів. Зростання кількості розглянутих справ при­зводить до зниження якості судочинства і, як наслідок, до зростання питомої ваги скасованих вироків (табл. 26).

Таблиця 26.

Залежність якості судочинства від завантаженості суддів.

Метод групувань, як й інші методи, дає змогу встановити наявність чи відсутність залежності між явищами, а також встановити загальний напрямок цієї залежності.

За допомогою статистичних групувань можна встановити вплив двох і більше факторів на зміну результативної ознаки (комбінаційні групування). Групування важливі і для вивчення зв'язків між якісними та кількісними по­казниками. Але метод групувань та інші розглянуті методи не дають змоги і не ставлять своїм завданням числове вираження щільності зв'язку. Це питан­ня розв’язується в статистиці лише за допомогою методів кореляції, розроб­лених математичною статистикою.

Графічний метод. Він використовується для попереднього встановлен­ня наявності зв`язку між явищами та розкриття характеру цього зв’язку, а також для вибору форми зв`язку. У статистиці його застосовують таким чином, на прямокутній системі координат наносяться індивідуальні значення ознаки (факторної) і відповідних йому значень результативної у вигляді окремих точок (див. рис. 18). На даному рисунку нанесені одночасно вік злочинців і кількість вчинених ними фактів хуліганства в окремих районах міста. Для умовного приклада ми взяли чотири райвідділи міста. Як видно з графіку, ця залежність є оберненою, чим старше злочинці, тим менше фактів хуліганства вони вчиняють . (Приклад умовний, дані наведені в табл. 27).

Таблиця 27.

Дані про кількість виявлених осіб, які вчинили хуліганство.

Рис. 18. Залежність кількості виявлених хуліганств від віку осіб, які їх вчинили.

З графіку (рис. 18) видно, що точки кореляційного поля лежать ні на од­ній лінії, вони витягнуті смугою зліва направо. Можна згрупувати ці дані по кожній віковій групі і знайти середні значення. (останній рядок табл. 27). Після цього нанести ці се­редні значення на графік і з`єднуючи їх послідовно відрізками прямих ліній , побудувати так звану емпіричну лінію зв`язку (на графіку 18 – перервна лінія).

Якщо ця емпірична лінія зв`язку по вигляду наближається до прямої лі­нії, то можна припустити наявність прямолінійної кореляційної залежності між факторною та результативною ознаками. На графіку 18 вона побудована, як лінія неперервна. Якщо ж є тенденція нерівномірної зміни значень ре­зультативної ознаки, і емпірична крива наближується до якої-небудь кривої, то це може бути пов`язано з наявністю криволінійної кореляційної залежно­сті.

Регресійний та дисперсійний метод аналізу зв'язків. Цей метод по­кликаний вирішити три основних завдання:

1) в результаті економічного аналізу встановити форму зв'язку і дати його математичне вираження за допомогою кореляційних рівнянь;

2) встановити щільність зв'язку між факторною (х) і результативною ознакою (у);

3) встановити ті фактори, які в даних конкретних умовах є головними щодо формування результативного фактору.

Перше завдання вирішується в ході аналізу того чи іншого явища. За­лежно від форми зв’язку, який визначено на основі попереднього якісного аналізу, кореляційні рівняння можуть мати різний вигляд. У статистиці вико­ристовуються прямолінійні та криволінійні кореляційні рівняння.

Теоретичної лінією регресії називають ту лінію, навколо якої групують­ся точки кореляційного поля і яка вказує основний напрямок, основну тен­денцію зв`язку. Теоретична лінія регресії повинна відображувати зміни се­редніх величин результативної ознаки ух відповідно до зміни факторної оз­наки х.

Якщо попередній аналіз явищ, зв’язок між якими вивчається, показує, що рівним змінам середніх значень факторної ознаки відповідають приблиз­но рівні зміни середніх значень результативної ознаки, то для вираження форми кореляційного зв’язку можна використати прямолінійне кореляційне рівняння:

ух = а0 + а1х,

де ух – ординати шуканої прямої, або вирівнюванні значення резуль­тативної ознаки; х – факторна ознака; а0 і а1 – параметри рівняння.

Перший параметр рівняння а0 – ордината лінії при х = 0. Параметр а1, який називається коефіцієнтом регресії, – це показник середньої зміни ознаки у на одиницю ознаки х в межах даного дослідження.

Якщо ми маємо обернену залежність між результативною та факторною ознакою, то рівняння лінійної залежності буде мати вигляд:

ух = а0 – а1х,.

Така лінія регресії нами побудована на рисунку 18. Її параметри будуть мати вигляд: y = 24,438-0,4978x.

Для знаходження параметрів рівняння а0 і а1 застосовують спосіб най­менших квадратів. Цей спосіб полягає в тому, що знаходять такі значення коефіцієнтів рівняння, при яких сума відхилень фактичних значень резуль­тативної ознаки від обчислених за допомогою рівняння буде найменша з усіх можливих, тобто сума відхилень точок кореляційного поля від відповідних точок теоретичної лінії регресії дорівнює нулю.

Якщо попередній аналіз досліджуваних явищ, зв'язок між якими вивча­ється, показує, що рівним змінам середніх значень факторної ознаки відпо­відають нерівні зміни середніх значень результативної ознаки, то для вира­ження загального характеру зв'язку застосовують криволінійні форми кореля­ційних рівнянь, з яких найбільш частіше використовуються вирівнювання за параболою і гіперболою.

Прямолінійне кореляційне рівняння має більш широке застосування, то­му що його параметри легше обчислити, хоча в реальному житті лінійний зв'язок між явищами суспільного життя зустрічається дуже рідко. Але якщо вибрати не тривалий термін часу, то яка завгодно крива лінія обов`язково на­ближується до прямої лінії. Тому вибір прямої лінії можна розглядати як де­яке спрощення дійсної залежності між явищами і істотного спрощення усіх розрахунків.

Друге завдання кореляційного аналізу – це вимірювання щільності зв'яз­ку, тобто ступеня впливу х на варіацію ознаки у. Щільність кореляційного зв'язку оцінюється за допомогою коефіцієнта кореляції та кореляційного від­ношення. Коефіцієнт кореляції – це числова характеристика, що виражає взаємозв'язок і спільний розподіл двох випадкових величин. Він достатньо точно оцінує ступінь щільності взаємозв`язку при наявності лінійної залеж­ності між факторними та результативною ознаками. При наявності криволі­нійної залежності він недооцінює ступінь щільності зв`язку, тому рекомен­дується використовувати у якості показника ступеню щільності зв`язку ко­реляційне відношення. Обчислення кореляційного відношення можливо ли­ше при наявності достатньо великої кількості даних, які наведені, як правило, у вигляді групової таблиці. Обчислення кореляційного відношення при вели­кій кількості груп і малої кількості одиниць у кожній групі позбавлено сенсу.

Індекс кореляції завжди повинен знаходитися в межах від нуля до оди­ниці. Якщо індекс кореляції дорівнює нулю, то немає ніякого взаємозв`язку між досліджуваними явищами, інакше кажучи, результативна ознака не за­лежить зовсім від зміни цієї факторної ознаки. Якщо індекс кореляції дорів­нює одиниці, то це свідчить про наявність повного, функціонального зв`язку між явищами, про те, що результативна ознака повністю залежить від зміни факторної ознаки.

Чим ближче одержаний результат до одиниці, тим більш щільно результативна ознака залежить від факторної, і навпаки.

Індекс кореляції може мати як знак плюс, так і знак мінус. Якщо залеж­ність між показниками пряма, то індекс кореляції має знак плюс; якщо залеж­ність між показниками обернена, то індекс кореляції матимемо знак мінус.

Оцінити щільність взаємозв`язку можна лише за допомогою законів ма­тематичної статистики. З цією метою застосовуються спеціальні таблиці. На практиці для більшості економічних розрахунків вважається, що він обов`язково повинен бути більше 0,75, щоб більше, ніж на три четверті зміна результативної ознаки складалась під впливом факторної.

За прикладом (табл. 27) коефіцієнт кореляції дорівнює -0,97247, тобто на 97,2 % вчинення злочину залежить від віку злочинців. (Умовний приклад). Якщо в дійсності коефіцієнт кореляції має таке значення, то слід мати на увазі, що в цьому випадку можна казати про те, що між показниками існує дуже щільний зв`язок, який наближує його до функціонального.

В юридичній науці була зроблена спроба розробити спеціальний коефіцієнт кореляції між показниками судимості та покарання, але ця формула не знайшла розповсюдження, тому ми її не наводимо.

Обчисливши лінійний коефіцієнт кореляції, оцінюючий ступінь зв`язку між змінами факторної та результативної ознаки, можна обчислити коефіці­єнт регресії, що дає змогу вирішити завдання обґрунтованого прогнозу тен­денцій зміни результативного фактору в майбутньому. Практичне викорис­тання рівнянь регресії з метою екстраполяції можливо лише в тоді, коли, ми вважаємо, що в майбутньому істотно не змінюються умови формування рів­нів ознаки, які лежали в основі обчислення параметрів рівняння регресії. Це ще раз підкреслює, що метод екстраполяції на основі рівнянь регресії може застосовуватися на практиці лише на не тривалий термін часу.

Ми зупинилися лише на розгляді питань парної кореляції. В дійсності ж при проведенні статистичного аналізу правових явищ слід вивчати багато­факторні кореляційні взаємозв`язки, тому що в практиці результативний фактор змінюється під впливом декількох причин, факторних ознак. Одночасне вивчення впливу їх провадиться на основі використання методів множинної кореляції. В цьому випадку можна обчислити часткові та множинні коефіцієнти кореляції, які дають змогу встановити вплив різних факторів на зміну результативної ознаки.

Якщо позначити фактори х1, х2, х3, …, хm, то лінійне рівняння множинної кореляційної залежності може бути у загальному вигляді записано таким чином:

ух1, х2, х3, …, хm = b0 + b1 х1+b2 х2 +b3 х3+ …+ bm хm.

По параметрам цього рівняння можна оцінити внесок кожного із факто­рів на зміну рівня результативного фактору. Коефіцієнти рівняння множин­ної регресії дають змогу встановити абсолютний розмір впливу факторів на рівень результативної ознаки і характеризують ступінь впливу кожного фактора на результативну ознаку при фіксованому (середньому) рівні інших факторів.

З метою порівняння оцінок ролі різних факторів у формуванні результа­тивної ознаки необхідно доповнити абсолютні показники відносними, таки­ми як коефіцієнт еластичності, бета та дельта-коефіцієнти, які дають змогу уточнити вплив різних факторів на ті чи інші результати. Так, частковий ко­ефіцієнт еластичності показує, на скільки відсотків в середньому змінюється результативна ознаки зі зміною ознаки-фактора (наприклад, першого) на один відсоток при фіксованому стані інших факторів. Бета-коефіцієнт дозво­ляє порівнювати вплив коливання різних факторів на варіацію результатив­ної ознаки, на основі чого виявляються фактори, в розвитку яких закладені найбільші резерви зміни результативної ознаки. З метою оцінки частки впли­ву кожного фактора у сумарний їх вплив розраховуються дельта-коефіцієнти. При достатньо значній кількості факторів, які включені до рівняння регресії, проводиться ранжування факторів за величиною цих коефіцієнтів.

Побудова багатофакторних регресійних рівнянь дозволяє дати кіль­кісний опис основних закономірностей досліджуваних явищ, відокремити іс­тотні фактори, які обумовили зміну результативної ознаки, та оцінити їх вплив.

Кореляційний аналіз дозволяє вимірити залежність юридично значущих явищ від інших, встановити взаємозв`язок рівнів попередніх і сучасних періодів часу одного і того ж явища. Цей останній вид кореляційного аналізу має назву авторегресійного або автокореляції.

Можливості широкого застосування методів кореляції в недалекому минулому стримувалося значною трудомісткістю необхідних розрахунків. Сьогодні при застосуванні сучасної обчислювальної техніки – ці обмеження не мають значення. Але роль дослідника при проведенні кореляційного аналізу залишається надзвичайно важливою, як на стадії попередньої підготовки масиву вихідної інформації, так і на стадії інтерпретації одержаних рівнянь регресії та їх практичному застосуванні.

Вивчення цих відносно складних проблем виходить за рамки підручника з правової статистики. Але базова підготовка юристів при необхідності дає змогу опанувати цими методами встановлення кореляційного зв`язку.

 

< Попередня   Наступна >