Розділ VIII Середні величини та показники варіації
Розділ VIII Середні величини та показники варіації
§ 1. Поняття середньої величини, її види і техніка обчислення
Середні величини належать до узагальнюючих показників. У статистиці всі показники розподіляються на індивідуальні та середні. Індивідуальні показники завжди характеризують окремі одиниці сукупності.
Необхідність в обчисленні середньої величини обумовлюється тим, що явища, які вивчаються й правовою статистикою, завжди мають масовий характер, а ознаки в окремих одиниць сукупності відрізняються одна від одної, інакше кажучи, варіюють.
Середня величина в статистиці — це узагальнюючий показник, який характеризує типовий розмір ознаки якісно однорідної сукупності в конкретних умовах простору і часу.
Головною передумовою для обчислення і застосування середніх величин є те, що вони не можуть обчислюватися для різнорідної сукупності. Це означає, що наукове використання середніх величин базується на його поєднанні з методом групування: спочатку слід поділити сукупність на окремі групи і тільки після цього обчислювати середні величини для якісно однорідних груп сукупності та сукупності в цілому.
У правовій статистиці середні величини використовуються для обчислення: зміни у структурі злочинності; середньої кількості осіб, яка припадає на один злочин; характеристики зміни в середньому віці злочинців за окремими видами злочинів і за всією злочинністю в цілому; характеристики додержання процесуальних строків (середні строки досудового слідства, розгляду кримінальних, цивільних та адміністративних справ); середньої величини збитків за окремими видами злочинів та ін.
Існують різні точки зору на визначення поняття середньої величини. Прихильники діалектичного підходу вважають, що в реальності існують різні індивідуальні одиниці, а середня величина — лише абстракція, яка характеризує в загальному вигляді сукупність у цілому. На нашу думку, ця точка зору є більш правильною. Таким чином, середній показник має тільки оціночне значення. У правовій статистиці, де окремі явища часто є унікальними, він ні в якому разі не може підміняти і тим більше заміняти вивчення індивідуального. Крім того, індивідуальні явища характеризують розподіл сукупності та дають змогу встановити одиниці, які істотно відрізняються від інших одиниць.
Щоб встановити їх закономірності та особливості в розвитку явища загальна середня величина, обчислена для всієї сукупності, повинна доповнюватися вивченням середніх показників за окремими групами, а також вивченням індивідуальних значень ознаки явища. Тому в правовій статистиці загальна середня величина по країні в цілому доповнюється середніми показниками по окремих регіонах.
За технікою обчислення всі середні величини можуть бути простими (незваженими) та зваженими, за класом всі вони належать до степеневої середньої. Загальна формула степеневої середньої має такий вигляд (перша формула — проста; друга — зважена):
де x — степенева середня величина; x — варіанти (значення ознаки одиниць сукупності); n — загальна кількість одиниць сукупності; f — вага, частота, яка показує, скільки разів зустрічається те чи інше значення ознаки; m — показник ступеня середньої; Е — знак суми.
За назвами в статистиці використовуються середня арифметична, середня хронологічна, середня геометрична, середня квадратична, середня гармонічна величини. Зміна значення показника степеневої середньої величини (m) визначає вид середньої величини: якщо m = 1, то ми одержуємо середню арифметичну величину; якщо m = 2, то маємо середню квадратичну; якщо m = 3, то отримуємо середню кубічну; якщо m = — 1, маємо середню гармонічну; якщо m = 0, то одержуємо середню геометричну. Із степеневих середніх у правовій статистиці найчастіше використовують середню арифметичну, значно рідше — середню гармонічну; середня геометрична застосовується тільки при обчисленні середніх темпів динаміки, а середня квадратична — при обчисленні показників варіації.
Розміри обчисленої середньої величини завжди відрізняються, оскільки обумовлюються показником степеня середньої величини. У загальному вигляді це правило має назву мажорантності середніх: чим більший показник ступеня, тим більша величина середньої. При цьому слід мати на увазі, що правильну характеристику різних сукупностей у кожному окремому випадку визначає лише певний вид середньої величини.
Залежно від того, як формується загальний обсяг сукупності, і визначається вид середньої величини. Середня арифметична застосовується тоді, коли обсяг варюючої ознаки утворюється як сума окремих варіантів; середня квадратична — коли обсяг варюючої ознаки має вигляд суми квадратів окремих варіантів; середня гармонічна — коли обсяг варюючої ознаки складається із суми обернених значень окремих варіантів; середня геометрична — коли обсяг варюючої ознаки одержується як добуток окремих варіантів.
Середні арифметичні величини застосовуються тоді, коли первинні (вихідні) дані наведено в такому вигляді, що загальний обсяг ознаки для всієї сукупності можна одержати шляхом їх підсумовування в усіх одиницях.
Середня арифметична проста (незважена) обчислюється шляхом ділення суми індивідуальних значень ознаки на їх загальну кількість. Спочатку підсумовують значення всіх варіантів, а потім ця сума ділиться на загальну кількість одиниць сукупності. Середня арифметична проста використовується дуже рідко, зазвичай, лише тоді, коли сукупність повністю симетрична (нормальний закон розподілу одиниць) або має невелику кількість одиниць.
У правовій статистиці застосовується середня арифметична зважена, яка обчислюється за формулою:
де Xa — середня арифметична величина; /1, /,, ..., /n — повторення (частота, вага) кожного варіанта; x1, x,, ..., xn _значення ознаки одиниць сукупності; Е — знак суми.
Середня арифметична зважена завжди обчислюється тоді, коли окремі значення варіантів у сукупності повторюються кілька разів або коли ряд розподілу значення ознаки несиметричний. При обчисленні середньої арифметичної зваженої за наведеною формулою значення кожного варіанта (ознаки кожної одиниці сукупності) слід помножити на відповідну йому вагу (частоту, або повторюваність кожного варіанта) і суму цих добутків поділити на суму частот (загальну кількість одиниць сукупності). При цьому перемноження значень ознак сукупності на кількість їх повторювання в сукупності (тобто варіантів на ваги) називається зважуванням, а одержана середня величина — зваженою.
Використання середньої арифметичної зваженої дає змогу замінити багаторазове підсумовування однакових варіантів, як це має місце при обчисленні середньої арифметичної простої.
Середня величина завжди має числове вираження в тих самих одиницях виміру, що й первинні дані. При цьому її розмір обов’язково знаходиться в межах від мінімального до максимального значення ознаки і вона не може бути меншою за мінімальне і більшою за максимальне значення ознаки.
Округлювати одержані дані можна лише таким чином, щоб не втратити реального змісту показника.
Частіше доводиться обчислювати середні арифметичні зважені з даних, наведених у статистичній звітності у вигляді інтервальних варіаційних рядів розподілу, коли значення варіантів подано не числом, а в межах інтервалу: від... до... Наприклад, у табл. 4 наведено дані про вік засуджених (інтервали подано так, як вони побудовані в статистичній картці на особу, стосовно якої судом розглянуто кримінальну справу).
Щоб обчислити середній вік усіх 200 осіб, засуджених за злочини проти власності, спочатку необхідно визначити середній вік кожної групи, тому що вік у документах первинного обліку наводиться у вигляді інтервалів. Середній вік для кожної групи умовно приймають як середину кожного інтервалу. Вона обчислюється як середня арифметична проста умовно, оскільки не завжди однаково зустрічаються особи різного віку в межах групи. Середина першої вікової групи буде дорівнювати 14,5 року ((14 + 15) : 2). Аналогічно обчислюється середина всіх інших інтервалів, крім останнього, бо в ньому відсутня верхня межа інтервалу. Останній інтервал повністю відкритий. Теоретично особа після 14 років, якщо вона вчинила злочин, може буде засуджена. У такому разі ця межа встановлюється умовно таким чином, щоб інтервал дорівнював сусідньому з ним. У нашому прикладі величина передостаннього інтервалу дорівнювала 15 рокам (65-50). Відповідно приймаємо верхню межу останнього інтервалу рівною 80 рокам (65 + 15), тоді середина становить 72,5 року ((65 + 80) : 2).
Після встановлення середини кожного інтервалу за наведеною вище формулою середньої арифметичної зваженої обчислюємо середній вік 200 засуджених за злочини проти власності. Він становить 29,5 року (5902 : 200).
При цьому слід мати на увазі, що середня величина, обчислена за даними інтервального варіаційного ряду розподілу, завжди є наближеною, тому що при її обчисленні робиться припущення про однакові розміри ознаки в кожної одиниці сукупності. Проте точних даних одержати неможливо, оскільки у звітності вони наведені в такому вигляді. Відомо, що чим більша величина інтервалу і чим більше одиниць у ньому, тим більше відхилень від дійсної середньої величини можна одержати. Істотно вплинути на розмір середньої величини, обчисленої з інтервального ряду, може й довільне встановлення межі відкритих інтервалів, тому що з підрахунку можуть повністю зникнути найбільш віддаленні значення ознаки.
§ 2. Поняття моди і медіани
Крім математично обчислених степеневих середніх величин, у статистиці застосовуються показники описового характеру — структурні середні, з яких найчастіше використовуються мода та медіана, котрі у впорядкованому ряду розподілу характеризують значення тенденцій окремих варіантів.
Модою в статистиці називається таке значення ознаки, яке зустрічається найчастіше. Якщо дані розташовані у вигляді дискретного ряду розподілу, то модою буде значення того варіанта, який має найбільшу частоту. Мода в статистиці застосовується тоді, коли слід охарактеризувати показник, який найчастіше зустрічається в сукупності. Наприклад, при вивченні цін на ринку встановлюємо ціни, які зустрічаються найчастіше; при встановленні найбільш ходового розміру взуття і одягу визначаємо той, який користується найбільшим попитом.
У правовій статистиці такі показники застосовуються лише для опису сукупності, а не для наукової характеристики явища. Наприклад, маємо такі первинні дані про вік осіб, які вчинили злочини проти особи, у районі міста за місяць: 17, 25, 30, 31, 27, 28, 15, 18, 21, 22, 25, 24, 16, 24, 26, 19, 32, 35, 19, 17, 20, 21, 22, 23, 22, 26 (дані вибрані з первинних облікових документів без їх оброблення). Порядок заповнення документів первинного обліку дає змогу позначити тільки ціле число повних років життя. Тому в цьому разі ми можемо обчислювати моду за принципом дискретного ряду розподілу, хоча первинні дані належать до ін- тервального варіаційного ряду. Мода в нашому прикладі дорівнюватиме 22 рокам, оскільки цей показник зустрічається найчастіше (тричі).
Медіаною в статистиці називають значення варіанти, яка ділить впорядкований ряд розподілу на дві рівні за чисельністю одиниць сукупності частини і знаходиться в середині ряду. Якщо всі значення дискретного ряду записати в певному порядку (зростання або зменшення значення показників), то це буде значення, яке знаходиться в середині ряду.
За наведеним раніше прикладом обчислимо медіану. Спочатку впорядкуємо дані про вік осіб, які вчинили злочини проти особи, розташувавши їх в ранжованому порядку зростання показників віку: 15, 16, 17, 17, 18, 19, 19, 20, 21, 21, 22, 22, 22, 23, 24, 24, 25, 25, 26, 26, 27, 28, 30, 31, 32, 35. Якщо б ми мали непарну кількість одиниць ряду, то центральна з них і була б медіаною. У нашому ж прикладі наявне парне число одиниць сукупності. Тоді медіана обчислюється як середня арифметична проста двох центральних варіантів. її місцезнаходження визначається за формулою (X/ + 1) : 2. До загальної кількості одиниць сукупності необхідно додати одиницю й одержане число поділити на 2. У нашому прикладі було наведено 26 осіб, які вчинили злочини. За наведеною формулою знаходимо місце медіани (26 + 1) : 2 = 13,5. Медіана знаходиться посередині між 13-м і 14-м значеннями та дорівнює 22,5 року, тобто між 22 і 23 роками.
За якою б формулою не обчислювали медіану, сутність її не змінюється. Медіана в будь-якому разі повинна поділити варіаційний ряд на дві рівні частини за сумою частот. Медіана як показник має перевагу перед іншими видами середніх величин, тому що вона не залежить від наявності чи відсутності показників в окремих інтервалах. На її розмір впливає лише порядок розташування показників, а також те, наскільки правильно побудовано ряд розподілу. У такому разі її обчислення нескладне.
Мода і медіана є специфічними видами середніх величин, оскільки вони завжди характеризують лише центр розподілу статистичної сукупності.
Моду, медіану та середню арифметичну слід завжди використовувати в сукупності, бо вони характеризують ряд розподілу неоднозначно. Якщо ряд симетричний, то вони повністю збігаються.
У нашому прикладі мода дорівнює 22 рокам, медіана — 22,5 року, а середній вік, який обчислюється за середньою арифметичною, — 23,3 року (додаємо всі первинні дані (15 + 16 + 17 + ... + 35 = 605) і ділимо їх на кількість осіб — на 26). Наведений ряд розподілу має асиметрію, але не значну.
§ 3. Показники варіації і способи їх обчислення
Середні величини мають велике теоретичне і практичне значення, оскільки вони дають змогу однією величиною охарактеризувати сукупність однотипних явищ. Проте для всебічної характеристики таких явищ їх недостатньо. Істотним при цьому є те, що повністю дати оцінку явищу за допомогою тільки середніх показників неможливо: коливання окремих ознак у різних сукупностях можуть бути значними і незначними, а середні величини при цьому будуть однаковими.
Щоб установити, як відрізняються сукупності, а також які межі коливання має ознака, необхідно обчислити варіацію. Варіацією називається коливання значень правової ознаки в окремих елементах сукупності.
Для вимірювання і кількісної характеристики варіації використовується система абсолютних і відносних показників: розмах варіації, середнє лінійне відхилення, середнє квадратичне відхилення і коефіцієнт варіації.
Розмах варіації — це різниця між найбільшим і найменшим значеннями ознаки в сукупності. Залежно від того, в якому вигляді наведені первинні дані, техніка обчислення цього показника є різною: це може бути різниця між верхньою межею останнього інтервалу і нижньою межею першого інтервалу або різниця між середніми значеннями цих інтервалів. Розмах варіації обчислюється за формулою:
де R — розмах варіації; xmax—найбільше значення ознаки в сукупності; xmin—найменше значення ознаки в сукупності.
Розмах варіації відображає тільки крайні значення ознаки, тому він є головним показником у тих випадках, коли варіанти повторюються один раз. В інших випадках розмах варіації застосовується для того, щоб одержати загальне уявлення про варіацію ознаки в усій сукупності.
Безумовною перевагою цього показника як міри оцінки коливання ознаки можна вважати нескладність його обчислення і розуміння. Але його недоліком є те, що він оцінює лише крайні коливання ознаки, а вони можуть бути для сукупності випадковими і зовсім не відображати розподіл відхилення ознаки в сукупності. Його часто використовують для попередньої оцінки варіації при статистичних розрахунках.
Середнє лінійне відхилення — це арифметична середня з абсолютних значень відхилень ознаки окремих варіантів від їх середньої арифметичної. Середнє лінійне відхилення обчислюється за формулою:
де Л — середнє лінійне відхилення; x — значення ознаки; x — середнє значення ознаки; f — частота (вага) кожного варіанта.
При обчисленні цього показника відхилення від середньої величини однаково оцінюються як у більший, так і в менший бік.
Середнє квадратичне відхилення — це корінь квадратний із середнього квадрата відхилень ознаки кожного варіанта від їх середньої арифметичної. Цей показник обчислюється за формулою:
де о — середнє квадратичне відхилення; x — значення ознаки; x середнє значення ознаки.
Усі наведені показники (розмах варіації, середнє лінійне і середнє квадратичне відхилення) дають змогу встановити й оцінити міру коливання ознак в абсолютному розмірі, тому всі вони обов’язково мають такі самі одиниці виміру, як і одиниці сукупності.
Розрахунок середнього квадратичного відхилення має логічний зміст лише в тому разі, коли фактичний розподіл ознаки близький до нормального. Для явно асиметричних розподілень його розрахунок не має сенсу.
Для більш детальної характеристики сукупності застосовується відносний показник — коефіцієнт варіації. Існують різні думки щодо того, за яким із показників його можна обчислювати. На практиці коефіцієнт варіації завжди порівнюють за допомогою середнього квадратичного відхилення, яке найбільш реалістично відображає коливання ознаки в сукупності.
Коефіцієнт варіації — це відсоткове відношення середнього квадратичного відхилення до середнього рівня. Як правило, цей середній рівень обчислюється за формулою середньої арифметичної. Коефіцієнт варіації обчислюється за формулою:
де V — коефіцієнт варіації; а — середнє квадратичне відхилення; X — середній розмір ознаки в статистичній сукупності.
Коефіцієнт варіації дає змогу порівняти різні сукупності. Чим менший цей показник, тим менше коливання ознаки в сукупності і тим більш однорідна сукупність, і навпаки.
Показник коефіцієнта варіації слід використовувати для оцінки однорідності сукупності. Існує оціночний критерій — сукупність однорідна і середня величина в ній є типовою, якщо коефіцієнт варіації не перевищує 33 %.
Питання та завдання для самоконтролю
1. Дайте визначення поняття середньої величини.
2. Назвіть види середніх величин, які використовуються у правовій статистиці.
3. Поясніть формулу обчислення середньої арифметичної.
4. Дайте визначення поняття моди і медіани та наведіть приклади їх використання в правовій статистиці.
5. Розкрийте зміст показників варіації статистичної сукупності: розмах варіації, середнє лінійне та середнє квадратичне відхилення, коефіцієнт варіації.
Завдання 1. Працівниками органу досудового слідства було розслідувано в строк до 1 місяця 420 кримінальних справ; у строк від 1 до 2 місяців — 632 справи; у строк від 2 до 3 місяців — 75 справ; у строк понад 3 місяці — 15 справ. Визначте середній строк до- судового слідства і вкажіть, який різновид середньої величини Вами застосовано і чому.
Завдання 2. Визначте середньомісячне навантаження на одного слідчого, якщо у відділі, де за штатним розкладом 22 слідчих, перебувало у провадженні: у січні — 160 справ, у лютому — 175 справ, у березні — 188 справ, у квітні — 155 справ, у травні — 182 справи, у червні — 190 справ. Укажіть, який вид середньої величини Вами обчислено і чому.