Головне меню

§ 3. Поняття моди та медіани

Правова статистика - ПРАВОВА СТАТИСТИКА
80

§ 3. Поняття моди та медіани

Крім математично обчислених степенних середніх величин у статистиці застосовуються показники описового характеру – структурні середні, з яких найчастіше використовуються мода та медіана, які у впорядкованому ряду розподілу характеризують значення тенденцій окремих варіантів.

Модою в статистиці називається таке значення ознаки, яке зустрічається найчастіше. Якщо дані розташовані у вигляді дискретного ряду розподілу, то модою буде значення того варіанту, який має найбільшу частоту. Мода в ста­тистиці застосовується тоді, коли слід охарактеризувати показник, який най­частіше зустрічається в сукупності. Наприклад, при вивченні цін на ринку встановлюємо ціни, які зустрічаються найчастіше; при встановленні най­більш ходового розміру взуття і одягу визначаємо той, який користується найбільшим попитом. Ці показники дають змогу спланувати, які товари не­обхідно виробляти в більшій кількості, а також які товари поставляти на ринок і за якими цінами.

Але в правовій статистиці такі показники застосовуються лише для опи­су сукупності, а не для наукової характеристики явища. Наприклад, маємо та­кі первинні дані про вік осіб, які вчинили злочини проти особи, в районі міс­та за місяць: 17, 25, 30, 31, 27, 28, 15, 18, 21, 22, 25, 24, 16, 24, 26, 19, 32, 35, 19, 17, 20, 21, 22, 23, 22, 26 (дані вибрані з первинних облікових документів без їх обробки). Порядок заповнення документів первинного обліку дає змогу позначити тільки ціле число повних років життя. Тому в цьому разі ми мо­жемо обчислювати моду за принципом дискретного ряду розподілу, хоча первинні дані відносяться до інтервального варіаційного ряду. Мода в нашо­му прикладі дорівнюватиме 22 роки, оскільки цей показник зустрічається найчастіше (три рази).

В інтервальному варіаційному ряду розподілу легко відшуковується ли­ше мо

дальний інтервал, а сама мода визначається приблизно. Формула обчислення моди в інтервальному ряду має такий вигляд:

М0 = Х0 + і ,

де: М0 – мода; X0 – нижня границя модального інтервалу; i – величина модального інтервалу; f1 – частота інтервалу, який передує модальному; f2 – частота модального інтервалу; f3 – частота інтервалу, який слідує після модального.

За даними табл. 10 обчислимо моду. Модальний інтервал становить від 18 до 24 років, тому що йому відповідає максимальна частота (48 засудже­них). Тоді мода матиме такий вигляд:

Медіаною в статистиці називають значення варіанти, яка ділить впо­рядкований ряд розподілу на дві рівні за чисельністю одиниць сукупності частини, знаходиться у середині ряду.

Якщо усі значення дискретного ряду записати в певному порядку (зро­стання або зменшення значення показників), то це буде значення, яке знахо­диться у середині ряду. За наведеним раніш прикладом обчислимо медіану. Спочатку впорядкуємо дані про вік осіб, які вчинили злочини проти особи, розташувавши дані в ранжованому порядку зростання показників віку: 15, 16, 17, 17, 18, 19, 19, 20, 21, 21, 22, 22, 22, 23, 24, 24, 25, 25, 26, 26, 27, 28, 30, 31, 32, 35. Якщо б ми мали непарну кількість одиниць ряду, то центральна з них і була б медіаною. В нашому ж прикладі наявне парне число одиниць сукуп­ності. Тоді медіана обчислюється як середня арифметична проста двох цент­ральних варіантів або за формулою (?? + 1) : 2. До загальної кількості оди­ниць сукупності необхідно додати одиницю і одержане число поділити на два. В нашому прикладі було наведено 26 особи, які вчинили злочини. За наведеною формулою знаходимо місце медіани (26 + 1):2 = 13,5. Медіана знаходиться посередині між 13 і 14 значеннями і дорівнює 22,5 рокам, тобто між 22 і 23 роками.

Складніше обчислюється медіана в варіаційному ряду. Існує така формула для її знаходження:

де: Ме – медіана; хн – нижня границя медіанного інтервалу; І – величина медіанного інтервалу; ?f – сума частот ряду; SМе-1 – сума накопичених частот інтервалу, попереднього медіанному; fМе – частота медіанного інтервалу.

За якою б формулою не обчислювали медіану, сутність її не видозміню­ється. Медіана в якому завгодно випадку повинна поділити варіаційний ряд на дві рівні частини за сумою частот. Тому спочатку в інтервальному ряду розподілу знаходимо інтервал, в якому розташована медіана, а потім приб­лизно обчислюємо саму медіану. За даними табл. 10 обчислимо медіану. З`ясовуємо, що інтервал, в якому знаходиться медіана, дорівнює від 18 до 24 років. Потім за формулою, яка наведена, обчислюємо медіану:

Медіана як показник має перевагу перед іншими видами середніх вели­чин, тому що вона не залежить від наявності чи відсутності показників в ок­ремих інтервалах. На її розмір впливає лише порядок розташування показни­ків, а також те, наскільки вірно побудовано ряд розподілу. В такому разі її обчислення нескладне.

Слід зауважити, що мода і медіана є специфічними видами середніх величин, тому що вони завжди характеризують лише центр розподілу стати­стичної сукупності.

Моду, медіану та середню арифметичну слід завжди використовувати у сукупності, оскільки вони характеризують ряд розподілу неоднозначно. Якщо ряд симетричний, то вони повністю співпадають.

В нашому прикладі, мода дорівнює 22 роки, медіана – 22,5 роки, а серед­ній вік, який обчислюється за середньою арифметичною, – 23,3 роки (додає­мо усі первинні дані (15 + 16 + 17 + … + 35 = 605) і ділимо їх на кількість осіб – на 26). Наведений ряд розподілу має асиметрію, але не значну. За даними табл. 10, маємо такі результати: середній вік – 26,3 роки; мода – 21,4 роки; медіана – 23,1 роки, тобто цей ряд має значно більшу асиметрію.

 

< Попередня   Наступна >