§ 3. Поняття моди та медіани
Правова статистика - ПРАВОВА СТАТИСТИКА |
§ 3. Поняття моди та медіани
Крім математично обчислених степенних середніх величин у статистиці застосовуються показники описового характеру – структурні середні, з яких найчастіше використовуються мода та медіана, які у впорядкованому ряду розподілу характеризують значення тенденцій окремих варіантів.
Модою в статистиці називається таке значення ознаки, яке зустрічається найчастіше. Якщо дані розташовані у вигляді дискретного ряду розподілу, то модою буде значення того варіанту, який має найбільшу частоту. Мода в статистиці застосовується тоді, коли слід охарактеризувати показник, який найчастіше зустрічається в сукупності. Наприклад, при вивченні цін на ринку встановлюємо ціни, які зустрічаються найчастіше; при встановленні найбільш ходового розміру взуття і одягу визначаємо той, який користується найбільшим попитом. Ці показники дають змогу спланувати, які товари необхідно виробляти в більшій кількості, а також які товари поставляти на ринок і за якими цінами.
Але в правовій статистиці такі показники застосовуються лише для опису сукупності, а не для наукової характеристики явища. Наприклад, маємо такі первинні дані про вік осіб, які вчинили злочини проти особи, в районі міста за місяць: 17, 25, 30, 31, 27, 28, 15, 18, 21, 22, 25, 24, 16, 24, 26, 19, 32, 35, 19, 17, 20, 21, 22, 23, 22, 26 (дані вибрані з первинних облікових документів без їх обробки). Порядок заповнення документів первинного обліку дає змогу позначити тільки ціле число повних років життя. Тому в цьому разі ми можемо обчислювати моду за принципом дискретного ряду розподілу, хоча первинні дані відносяться до інтервального варіаційного ряду. Мода в нашому прикладі дорівнюватиме 22 роки, оскільки цей показник зустрічається найчастіше (три рази).
В інтервальному варіаційному ряду розподілу легко відшуковується лише мо
М0 = Х0 + і ,
де: М0 – мода; X0 – нижня границя модального інтервалу; i – величина модального інтервалу; f1 – частота інтервалу, який передує модальному; f2 – частота модального інтервалу; f3 – частота інтервалу, який слідує після модального.
За даними табл. 10 обчислимо моду. Модальний інтервал становить від 18 до 24 років, тому що йому відповідає максимальна частота (48 засуджених). Тоді мода матиме такий вигляд:
Медіаною в статистиці називають значення варіанти, яка ділить впорядкований ряд розподілу на дві рівні за чисельністю одиниць сукупності частини, знаходиться у середині ряду.
Якщо усі значення дискретного ряду записати в певному порядку (зростання або зменшення значення показників), то це буде значення, яке знаходиться у середині ряду. За наведеним раніш прикладом обчислимо медіану. Спочатку впорядкуємо дані про вік осіб, які вчинили злочини проти особи, розташувавши дані в ранжованому порядку зростання показників віку: 15, 16, 17, 17, 18, 19, 19, 20, 21, 21, 22, 22, 22, 23, 24, 24, 25, 25, 26, 26, 27, 28, 30, 31, 32, 35. Якщо б ми мали непарну кількість одиниць ряду, то центральна з них і була б медіаною. В нашому ж прикладі наявне парне число одиниць сукупності. Тоді медіана обчислюється як середня арифметична проста двох центральних варіантів або за формулою (?? + 1) : 2. До загальної кількості одиниць сукупності необхідно додати одиницю і одержане число поділити на два. В нашому прикладі було наведено 26 особи, які вчинили злочини. За наведеною формулою знаходимо місце медіани (26 + 1):2 = 13,5. Медіана знаходиться посередині між 13 і 14 значеннями і дорівнює 22,5 рокам, тобто між 22 і 23 роками.
Складніше обчислюється медіана в варіаційному ряду. Існує така формула для її знаходження:
де: Ме – медіана; хн – нижня границя медіанного інтервалу; І – величина медіанного інтервалу; ?f – сума частот ряду; SМе-1 – сума накопичених частот інтервалу, попереднього медіанному; fМе – частота медіанного інтервалу.
За якою б формулою не обчислювали медіану, сутність її не видозмінюється. Медіана в якому завгодно випадку повинна поділити варіаційний ряд на дві рівні частини за сумою частот. Тому спочатку в інтервальному ряду розподілу знаходимо інтервал, в якому розташована медіана, а потім приблизно обчислюємо саму медіану. За даними табл. 10 обчислимо медіану. З`ясовуємо, що інтервал, в якому знаходиться медіана, дорівнює від 18 до 24 років. Потім за формулою, яка наведена, обчислюємо медіану:
Медіана як показник має перевагу перед іншими видами середніх величин, тому що вона не залежить від наявності чи відсутності показників в окремих інтервалах. На її розмір впливає лише порядок розташування показників, а також те, наскільки вірно побудовано ряд розподілу. В такому разі її обчислення нескладне.
Слід зауважити, що мода і медіана є специфічними видами середніх величин, тому що вони завжди характеризують лише центр розподілу статистичної сукупності.
Моду, медіану та середню арифметичну слід завжди використовувати у сукупності, оскільки вони характеризують ряд розподілу неоднозначно. Якщо ряд симетричний, то вони повністю співпадають.
В нашому прикладі, мода дорівнює 22 роки, медіана – 22,5 роки, а середній вік, який обчислюється за середньою арифметичною, – 23,3 роки (додаємо усі первинні дані (15 + 16 + 17 + … + 35 = 605) і ділимо їх на кількість осіб – на 26). Наведений ряд розподілу має асиметрію, але не значну. За даними табл. 10, маємо такі результати: середній вік – 26,3 роки; мода – 21,4 роки; медіана – 23,1 роки, тобто цей ряд має значно більшу асиметрію.
< Попередня Наступна >