§ 3. Основні питання методології статистичних групувань
Правова статистика - ПРАВОВА СТАТИСТИКА |
§ 3. Основні питання методології статистичних групувань
Основні питання методології статистичних групувань охоплюють такі питання: 1) вибір групувальної ознаки; 2) вибір кількості груп та інтервалів; 3) вибір кількості ознак, за якими проводиться групування. Усі ці питання вирішуються залежно від сутності та тенденцій розвитку досліджуваних явищ.
Найголовніше питання теорії групувань – це вибір групувальних ознак, за якими відмежовуються окремі групи. Суспільні явища відрізняються значною кількістю різноманітних рис. При проведенні групування обов`язково виникає питання про вибір такої ознаки, яка буде адекватна меті дослідження і характеру первинної інформації. При проведенні групування обов`язково слід вибрати істотну ознаку, яка найбільш повно і точно зможе схарактеризувати досліджуване явище, дасть змогу вивчити його типові риси і властивості. При цьому необхідно також враховувати зміни в суспільному житті, і при вивченні явищ точно додержуватися принципу місця і часу їх виникнення і існування.
Групувальні ознаки за формою вираження можна поділити на атрибутивні (якісні) та кількісні, а за характером коливання ознаки – на альтернативні та ознаки, які мають числові різновиди.
Атрибутивна ознака характеризує властивості, якість даного явища і не має кількісного виразу. Кількість груп при проведенні групування за атрибутивною (якісною) ознакою визначається числом різновидів цієї ознаки. Наприклад, групування населення за статтю матиме дві групи (чоловіки і жінки); за рівнем освіти – 7 груп (повна вища, базова вища, професійно-технічна, повна загальна середня, базова загальна середня, початкова загальна та без освіти). У випадках, коли різновидів атрибутивної ознаки значна кількість, то статистичні органи складають спеціальні класифікатори, переліки груп (наприклад, групування о
Якщо ознака альтернативна, то можливо утворення лише двох груп: в одній одиниці сукупності мають цю ознаку, а в іншій – не мають (наприклад, особа або судима, або ні). При наявності альтернативної ознаки може існувати лише два варіанти значень (1 ознака існує, 0 – відсутність ознаки).
Кількісна ознака має числове вираження, вона завжди є у кожної одиниці сукупності, але в різних розмірах, (наприклад, групування працівників за стажем роботи, за розміром заробітної плати; осіб, які вчинили злочин, за кількістю попередніх судимостей і т. п.). При проведенні групування за кількісною ознакою питання про кількість груп і розмір інтервалів має вирішуватися одразу при проведенні групування.
Питання про вибір кількості груп та величину інтервалів є дуже складним, вирішення його пов`язане з конкретним завданням дослідження. Як загальний принцип виступає вимога, щоб кількість груп була не надто великою і не надто малою, і щоб до кожної групи потрапила достатня кількість одиниць сукупності. Якщо цей принцип не додержується, то при побудові значної кількості груп може бути такий випадок, що однорідні одиниці сукупності опиняться у різних групах. І навпаки, при побудові незначної кількості груп до однієї й тієї ж групи будуть заноситися різні одиниці, що може привести до помилкових висновків усього проведеного статистичного дослідження. Наприклад, віковий інтервал осіб, які засуджені, включає в себе осіб у віці 30 – 50 років, складає найбільшу питому вагу серед усіх осіб, хоча злочинна активність після 30 років (якщо розглядати по окремому року) знижується. Але за зведеними статистичними даними різних звітів це важко встановити, тому що цей інтервал охоплював двадцять вікових груп, а інші інтервали значно менше. (“Статистична картка на підсудного (обвинуваченого)” включає такі вікові групи: 14 – 16; 16 – 18; 18 – 25; 25 – 30; 30 – 50; 50 –
65; старше 65. Відповідно інтервал 14 – 16 – два роки; 16 – 18 – також два роки; 18 – 25 – сім років; 25 – 30 – п`ять років; 50 – 65 – чотирнадцять років). Це ще раз підкреслює необхідність наукового обґрунтування, як встановлення вікових інтервалів, так і наукової інтерпретації одержаних даних внаслідок такого розподілу вікових груп.
Вимога про те, щоб до кожної групи потрапила достатньо велика кількість одиниць сукупності, випливає з теоретичного положення математики, згідно з яким для одержання типових показників необхідно брати значну кількість одиниць сукупності. Але в окремих випадках інтерес становлять і малочисельні групи, якщо вони характеризують нове явище, яке тільки народжується і ще не має масового характеру. При вирішенні питання про чисельність одиниць групи необхідно також враховувати сутність і тенденції розвитку досліджуваного явища. Орієнтовно, з точки зору математики, кількість груп можна обчислити за формулою американського вченого Стерджесса:
N = 1 + 3,322 lg N,
де n – кількість груп;
N – кількість одиниць сукупності, або її загальний обсяг.
Застосовуючи цю формулу, обсяг сукупності і кількість груп можна встановити таким чином: якщо обсяг сукупності до 24 одиниць, то груп – 5; якщо обсяг сукупності від 25 до 44, то треба утворити груп 6; якщо обсяг сукупності від 45 до 89 одиниць, то груп 7; якщо обсяг сукупності від 90 до 179, то груп 8; якщо обсяг сукупності від 180 до 359, то груп 9; якщо обсяг сукупності від 360 до 719, то груп 10; якщо обсяг сукупності від 720 до 1439 одиниць, то груп 11. Висновок – чим більше одиниць сукупності, тим більше можна і треба утворювати груп. Що стосується кожного окремого випадку, то завдання утворення кількості груп вирішується по-різному з урахуванням конкретних завдань і умов існування сукупності і її проявів. Наведена вище формула може вважатися лише орієнтиром для утворення груп сукупності. Реально їх створювати треба з урахуванням соціально-економічної сутності досліджуваних явищ.
При розгляді питання про вибір розміру інтервалів слід також керуватися знанням сутності досліджуваного явища. З точки зору теорії статистики інтервали можуть бути рівні та нерівні. В статистиці інтервалом називають різницю між максимальним і мінімальним значеннями ознаки в кожній групі.
Якщо значення групувальної ознаки змінюються рівномірно, то виділяються рівні інтервали груп за формулою:
i = ,
де: Хмакс, Хмін – найбільше і найменше значення ознаки всієї сукупності;
n – кількість груп.
Наприклад, необхідно згрупувати студентів за віком, утворивши 8 груп з рівними інтервалами, якщо відомо, що вік (кількість років, що повністю виповнилися) знаходиться в межах від 16 до 32 років. Розмір інтервалу буде 2 роки [(32–16):8]. Звідси слід утворити такі групи: 16–18, 18–20, 20–22, 22–24, 24–26, 26–28, 28–30, 30–32. Обов`язково треба вирішити питання про позначення нижньої та верхньої межі кожного інтервалу (або від, або до, або від … до …). (Статистична картка на підсудного (обвинуваченого) має такі інтервали від … до …).
На практиці, при вивченні правових явищ рівні інтервали застосовуються дуже рідко, тому що частіше за все однакова кількість ознаки має різне якісне значення, наприклад, групування за строками позбавлення волі. В правовій статистиці в основному застосовують прогресивно збільшувані інтервали і частіше за все межі інтервалів відокремлюються таким чином, щоб було повністю зрозуміло, до якого інтервалу відносити те чи інше явище. Наприклад, законодавець розробив такі групи для вивчення віку осіб, які вчинили злочин: 14–15 років, 16–17 років, 18–24 роки, 25–28 років, 29–39 років, 40–49 років, 50–59 років, 60 років і більше. В цьому випадку зрозуміло що у останню групу входять особи, яким виповнилось 60 років (тобто верхня межа включається у цю групу).
(Якщо, навпаки, необхідно вказати, що верхні межі інтервалів не входять у цю групу, тоді в останній групі треба записати старше 60 років).
Залежно від кількості ознак, за якими провадиться групування, воно може бути простим і складним. Просте групування проводиться за однією ознакою, наприклад, групування засуджених за видами злочинів. Складне групування – за кількома ознаками, воно може бути комбінаційним і багатомірним. Комбінаційним є таке групування, якщо воно побудоване за двома і більше поєднаними ознаками, коли кожна група, яка побудована за однією ознакою, поділяється ще на підгрупи за іншими ознаками (наприклад, групування осіб, які вчинили злочин, за видами злочинів і статтю або віком у поєднані). Ці групувань дають змогу вирішити багато завдань у галузі виділення типів і структурних зрушень, а також вивченні взаємозв‘язків між явищами. Багатомірним є групування, яке побудоване за кількома ознаками одночасно. Наприклад, групування сімей за рівнем споживання продовольчих і непродовольчих товарів одночасно. Таке групування можна проводити за великим набором ознак. Цей вид групувань спирається на метод розпізнавання образів – кластерний аналіз (від англ. cluster – скупчення, група елементів, які характеризуються якоюсь загальною якістю). В цьому випадку досліджується сукупність не послідовно за окремими ознаками (як при комбінаційному групуванні), а одночасно за великою кількістю ознак.
< Попередня Наступна >