Печать

Розділ VIII Середні величини та показники варіації

Posted in Учебные материалы - Правова статистика (В.В. Голіна)

Рейтинг пользователей: / 2
ХудшийЛучший 

Розділ VIII Середні величини та показники варіації

 

§ 1. Поняття середньої величини, її види і техніка обчислення

Середні величини належать до узагальнюючих показників. У статис­тиці всі показники розподіляються на індивідуальні та середні. Індивіду­альні показники завжди характеризують окремі одиниці сукупності.

Необхідність в обчисленні середньої величини обумовлюється тим, що явища, які вивчаються й правовою статистикою, завжди мають масовий характер, а ознаки в окремих одиниць сукупності відрізня­ються одна від одної, інакше кажучи, варіюють.

Середня величина в статистиці — це узагальнюючий показник, який характеризує типовий розмір ознаки якісно однорідної сукупнос­ті в конкретних умовах простору і часу.

Головною передумовою для обчислення і застосування середніх величин є те, що вони не можуть обчислюватися для різнорідної сукуп­ності. Це означає, що наукове використання середніх величин базується на його поєднанні з методом групування: спочатку слід поділити сукуп­ність на окремі групи і тільки після цього обчислювати середні величи­ни для якісно однорідних груп сукупності та сукупності в цілому.

У правовій статистиці середні величини використовуються для обчис­лення: зміни у структурі злочинності; середньої кількості осіб, яка при­падає на один злочин; характеристики зміни в середньому віці злочинців за окремими видами злочинів і за всією злочинністю в цілому; характе­ристики додержання процесуальних строків (середні строки досудового слідства, розгляду кримінальних, цивільних та адміністративних справ); середньої величини збитків за окремими видами злочинів та ін.

Існують різні точки зору на визначення поняття середньої величини. Прихильники діалектичного підходу вважають, що в реальності існують різні індивідуальні одиниці, а середня величина — лише абстракція, яка характеризує в загальному вигляді сукупність у цілому. На нашу думку, ця точка зору є більш правильною. Таким чином, середній показник має тільки оціночне значення. У правовій статистиці, де окремі явища часто є унікальними, він ні в якому разі не може підміняти і тим більше за­міняти вивчення індивідуального. Крім того, індивідуальні явища ха­рактеризують розподіл сукупності та дають змогу встановити одиниці, які істотно відрізняються від інших одиниць.

Щоб встановити їх закономірності та особливості в розвитку яви­ща загальна середня величина, обчислена для всієї сукупності, повинна доповнюватися вивченням середніх показників за окремими групами, а також вивченням індивідуальних значень ознаки явища. Тому в пра­вовій статистиці загальна середня величина по країні в цілому допо­внюється середніми показниками по окремих регіонах.

За технікою обчислення всі середні величини можуть бути про­стими (незваженими) та зваженими, за класом всі вони належать до степеневої середньої. Загальна формула степеневої середньої має такий вигляд (перша формула — проста; друга — зважена):

де x — степенева середня величина; x — варіанти (значення озна­ки одиниць сукупності); n — загальна кількість одиниць сукупності; f — вага, частота, яка показує, скільки разів зустрічається те чи інше значення ознаки; m — показник ступеня середньої; Е — знак суми.

За назвами в статистиці використовуються середня арифметична, середня хронологічна, середня геометрична, середня квадратична, се­редня гармонічна величини. Зміна значення показника степеневої се­редньої величини (m) визначає вид середньої величини: якщо m = 1, то ми одержуємо середню арифметичну величину; якщо m = 2, то маємо середню квадратичну; якщо m = 3, то отримуємо середню ку­бічну; якщо m = — 1, маємо середню гармонічну; якщо m = 0, то одержуємо середню геометричну. Із степеневих середніх у правовій статистиці найчастіше використовують середню арифметичну, значно рідше — середню гармонічну; середня геометрична застосовується тільки при обчисленні середніх темпів динаміки, а середня квадратич­на — при обчисленні показників варіації.

Розміри обчисленої середньої величини завжди відрізняються, оскіль­ки обумовлюються показником степеня середньої величини. У загально­му вигляді це правило має назву мажорантності середніх: чим більший показник ступеня, тим більша величина середньої. При цьому слід мати на увазі, що правильну характеристику різних сукупностей у кожному окремому випадку визначає лише певний вид середньої величини.

Залежно від того, як формується загальний обсяг сукупності, і визначається вид середньої величини. Середня арифметична засто­совується тоді, коли обсяг варюючої ознаки утворюється як сума окре­мих варіантів; середня квадратична — коли обсяг варюючої ознаки має вигляд суми квадратів окремих варіантів; середня гармонічна — коли обсяг варюючої ознаки складається із суми обернених значень окремих варіантів; середня геометрична — коли обсяг варюючої ознаки одер­жується як добуток окремих варіантів.

Середні арифметичні величини застосовуються тоді, коли первин­ні (вихідні) дані наведено в такому вигляді, що загальний обсяг ознаки для всієї сукупності можна одержати шляхом їх підсумовування в усіх одиницях.

Середня арифметична проста (незважена) обчислюється шляхом ділення суми індивідуальних значень ознаки на їх загальну кількість. Спочатку підсумовують значення всіх варіантів, а потім ця сума ді­литься на загальну кількість одиниць сукупності. Середня арифметич­на проста використовується дуже рідко, зазвичай, лише тоді, коли су­купність повністю симетрична (нормальний закон розподілу одиниць) або має невелику кількість одиниць.

У правовій статистиці застосовується середня арифметична зваже­на, яка обчислюється за формулою:

де Xa — середня арифметична величина; /1, /,, ..., /n — повто­рення (частота, вага) кожного варіанта; x1, x,, ..., xn _значення ознаки одиниць сукупності; Е — знак суми.

Середня арифметична зважена завжди обчислюється тоді, коли окремі значення варіантів у сукупності повторюються кілька разів або коли ряд розподілу значення ознаки несиметричний. При обчисленні середньої арифметичної зваженої за наведеною формулою значення кожного варіанта (ознаки кожної одиниці сукупності) слід помножити на відповідну йому вагу (частоту, або повторюваність кожного варіанта) і суму цих добутків поділити на суму частот (загальну кількість одиниць сукупності). При цьому перемноження значень ознак сукупності на кількість їх повторювання в сукупності (тобто варіантів на ваги) нази­вається зважуванням, а одержана середня величина — зваженою.

Використання середньої арифметичної зваженої дає змогу заміни­ти багаторазове підсумовування однакових варіантів, як це має місце при обчисленні середньої арифметичної простої.

Середня величина завжди має числове вираження в тих самих одиницях виміру, що й первинні дані. При цьому її розмір обов’язково знаходиться в межах від мінімального до максимального значення ознаки і вона не може бути меншою за мінімальне і більшою за мак­симальне значення ознаки.

Округлювати одержані дані можна лише таким чином, щоб не втратити реального змісту показника.

Частіше доводиться обчислювати середні арифметичні зважені з да­них, наведених у статистичній звітності у вигляді інтервальних варіа­ційних рядів розподілу, коли значення варіантів подано не числом, а в межах інтервалу: від... до... Наприклад, у табл. 4 наведено дані про вік засуджених (інтервали подано так, як вони побудовані в статистичній картці на особу, стосовно якої судом розглянуто кримінальну справу).

 

Щоб обчислити середній вік усіх 200 осіб, засуджених за злочини проти власності, спочатку необхідно визначити середній вік кожної групи, тому що вік у документах первинного обліку наводиться у ви­гляді інтервалів. Середній вік для кожної групи умовно приймають як середину кожного інтервалу. Вона обчислюється як середня арифметич­на проста умовно, оскільки не завжди однаково зустрічаються особи різного віку в межах групи. Середина першої вікової групи буде дорів­нювати 14,5 року ((14 + 15) : 2). Аналогічно обчислюється середина всіх інших інтервалів, крім останнього, бо в ньому відсутня верхня межа інтервалу. Останній інтервал повністю відкритий. Теоретично особа після 14 років, якщо вона вчинила злочин, може буде засуджена. У та­кому разі ця межа встановлюється умовно таким чином, щоб інтервал дорівнював сусідньому з ним. У нашому прикладі величина передос­таннього інтервалу дорівнювала 15 рокам (65-50). Відповідно прийма­ємо верхню межу останнього інтервалу рівною 80 рокам (65 + 15), тоді середина становить 72,5 року ((65 + 80) : 2).

Після встановлення середини кожного інтервалу за наведеною вище формулою середньої арифметичної зваженої обчислюємо середній вік 200 засуджених за злочини проти власності. Він становить 29,5 року (5902 : 200).

При цьому слід мати на увазі, що середня величина, обчислена за даними інтервального варіаційного ряду розподілу, завжди є наближе­ною, тому що при її обчисленні робиться припущення про однакові розміри ознаки в кожної одиниці сукупності. Проте точних даних одержати неможливо, оскільки у звітності вони наведені в такому ви­гляді. Відомо, що чим більша величина інтервалу і чим більше одиниць у ньому, тим більше відхилень від дійсної середньої величини можна одержати. Істотно вплинути на розмір середньої величини, обчисленої з інтервального ряду, може й довільне встановлення межі відкритих інтервалів, тому що з підрахунку можуть повністю зникнути найбільш віддаленні значення ознаки.


§ 2. Поняття моди і медіани

Крім математично обчислених степеневих середніх величин, у ста­тистиці застосовуються показники описового характеру — структурні середні, з яких найчастіше використовуються мода та медіана, котрі у впорядкованому ряду розподілу характеризують значення тенденцій окремих варіантів.

Модою в статистиці називається таке значення ознаки, яке зустрі­чається найчастіше. Якщо дані розташовані у вигляді дискретного ряду розподілу, то модою буде значення того варіанта, який має найбільшу частоту. Мода в статистиці застосовується тоді, коли слід охарактери­зувати показник, який найчастіше зустрічається в сукупності. Напри­клад, при вивченні цін на ринку встановлюємо ціни, які зустрічаються найчастіше; при встановленні найбільш ходового розміру взуття і одя­гу визначаємо той, який користується найбільшим попитом.

У правовій статистиці такі показники застосовуються лише для опису сукупності, а не для наукової характеристики явища. Наприклад, маємо такі первинні дані про вік осіб, які вчинили злочини проти особи, у районі міста за місяць: 17, 25, 30, 31, 27, 28, 15, 18, 21, 22, 25, 24, 16, 24, 26, 19, 32, 35, 19, 17, 20, 21, 22, 23, 22, 26 (дані вибрані з первинних облікових документів без їх оброблення). Порядок заповнення докумен­тів первинного обліку дає змогу позначити тільки ціле число повних років життя. Тому в цьому разі ми можемо обчислювати моду за прин­ципом дискретного ряду розподілу, хоча первинні дані належать до ін- тервального варіаційного ряду. Мода в нашому прикладі дорівнюватиме 22 рокам, оскільки цей показник зустрічається найчастіше (тричі).

Медіаною в статистиці називають значення варіанти, яка ділить впорядкований ряд розподілу на дві рівні за чисельністю одиниць сукупності частини і знаходиться в середині ряду. Якщо всі значення дискретного ряду записати в певному порядку (зростання або змен­шення значення показників), то це буде значення, яке знаходиться в середині ряду.

За наведеним раніше прикладом обчислимо медіану. Спочатку впо­рядкуємо дані про вік осіб, які вчинили злочини проти особи, розта­шувавши їх в ранжованому порядку зростання показників віку: 15, 16, 17, 17, 18, 19, 19, 20, 21, 21, 22, 22, 22, 23, 24, 24, 25, 25, 26, 26, 27, 28, 30, 31, 32, 35. Якщо б ми мали непарну кількість одиниць ряду, то центральна з них і була б медіаною. У нашому ж прикладі наявне пар­не число одиниць сукупності. Тоді медіана обчислюється як середня арифметична проста двох центральних варіантів. її місцезнаходження визначається за формулою (X/ + 1) : 2. До загальної кількості одиниць сукупності необхідно додати одиницю й одержане число поділити на 2.  У нашому прикладі було наведено 26 осіб, які вчинили злочини. За наведеною формулою знаходимо місце медіани (26 + 1) : 2 = 13,5. Медіана знаходиться посередині між 13-м і 14-м значеннями та до­рівнює 22,5 року, тобто між 22 і 23 роками.

За якою б формулою не обчислювали медіану, сутність її не зміню­ється. Медіана в будь-якому разі повинна поділити варіаційний ряд на дві рівні частини за сумою частот. Медіана як показник має перевагу перед іншими видами середніх величин, тому що вона не залежить від наявності чи відсутності показників в окремих інтервалах. На її розмір впливає лише порядок розташування показників, а також те, наскільки правильно побудовано ряд розподілу. У такому разі її обчислення не­складне.

Мода і медіана є специфічними видами середніх величин, оскільки вони завжди характеризують лише центр розподілу статистичної су­купності.

Моду, медіану та середню арифметичну слід завжди використову­вати в сукупності, бо вони характеризують ряд розподілу неоднознач­но. Якщо ряд симетричний, то вони повністю збігаються.

У нашому прикладі мода дорівнює 22 рокам, медіана — 22,5 року, а середній вік, який обчислюється за середньою арифметичною, — 23,3 року (додаємо всі первинні дані (15 + 16 + 17 + ... + 35 = 605) і ділимо їх на кількість осіб — на 26). Наведений ряд розподілу має асиметрію, але не значну.


§ 3. Показники варіації і способи їх обчислення

Середні величини мають велике теоретичне і практичне значення, оскільки вони дають змогу однією величиною охарактеризувати су­купність однотипних явищ. Проте для всебічної характеристики таких явищ їх недостатньо. Істотним при цьому є те, що повністю дати оцін­ку явищу за допомогою тільки середніх показників неможливо: коли­вання окремих ознак у різних сукупностях можуть бути значними і незначними, а середні величини при цьому будуть однаковими.

Щоб установити, як відрізняються сукупності, а також які межі коливання має ознака, необхідно обчислити варіацію. Варіацією на­зивається коливання значень правової ознаки в окремих елементах сукупності.

Для вимірювання і кількісної характеристики варіації використо­вується система абсолютних і відносних показників: розмах варіації, середнє лінійне відхилення, середнє квадратичне відхилення і коефі­цієнт варіації.

Розмах варіації — це різниця між найбільшим і найменшим зна­ченнями ознаки в сукупності. Залежно від того, в якому вигляді на­ведені первинні дані, техніка обчислення цього показника є різною: це може бути різниця між верхньою межею останнього інтервалу і ниж­ньою межею першого інтервалу або різниця між середніми значення­ми цих інтервалів. Розмах варіації обчислюється за формулою:

де R — розмах варіації; xmax—найбільше значення ознаки в сукупнос­ті; xminнайменше значення ознаки в сукупності.

Розмах варіації відображає тільки крайні значення ознаки, тому він є головним показником у тих випадках, коли варіанти повторюються один раз. В інших випадках розмах варіації застосовується для того, щоб одержати загальне уявлення про варіацію ознаки в усій сукупності.

Безумовною перевагою цього показника як міри оцінки коливання ознаки можна вважати нескладність його обчислення і розуміння. Але його недоліком є те, що він оцінює лише крайні коливання ознаки, а вони можуть бути для сукупності випадковими і зовсім не відображати роз­поділ відхилення ознаки в сукупності. Його часто використовують для попередньої оцінки варіації при статистичних розрахунках.

Середнє лінійне відхилення — це арифметична середня з абсолют­них значень відхилень ознаки окремих варіантів від їх середньої ариф­метичної. Середнє лінійне відхилення обчислюється за формулою:

де Л — середнє лінійне відхилення; x — значення ознаки; x — серед­нє значення ознаки; f — частота (вага) кожного варіанта.

При обчисленні цього показника відхилення від середньої величи­ни однаково оцінюються як у більший, так і в менший бік.

Середнє квадратичне відхилення — це корінь квадратний із середнього квадрата відхилень ознаки кожного варіанта від їх середньої арифметичної. Цей показник обчислюється за формулою:

 

де о — середнє квадратичне відхилення; x — значення ознаки; x середнє значення ознаки.

Усі наведені показники (розмах варіації, середнє лінійне і середнє квадратичне відхилення) дають змогу встановити й оцінити міру ко­ливання ознак в абсолютному розмірі, тому всі вони обов’язково мають такі самі одиниці виміру, як і одиниці сукупності.

Розрахунок середнього квадратичного відхилення має логічний зміст лише в тому разі, коли фактичний розподіл ознаки близький до нормального. Для явно асиметричних розподілень його розрахунок не має сенсу.

Для більш детальної характеристики сукупності застосовується відносний показник — коефіцієнт варіації. Існують різні думки щодо того, за яким із показників його можна обчислювати. На практиці ко­ефіцієнт варіації завжди порівнюють за допомогою середнього квадра­тичного відхилення, яке найбільш реалістично відображає коливання ознаки в сукупності.

Коефіцієнт варіації — це відсоткове відношення середнього квадратичного відхилення до середнього рівня. Як правило, цей серед­ній рівень обчислюється за формулою середньої арифметичної. Кое­фіцієнт варіації обчислюється за формулою:

де V — коефіцієнт варіації; а — середнє квадратичне відхилення; X — середній розмір ознаки в статистичній сукупності.

Коефіцієнт варіації дає змогу порівняти різні сукупності. Чим менший цей показник, тим менше коливання ознаки в сукупності і тим більш однорідна сукупність, і навпаки.

Показник коефіцієнта варіації слід використовувати для оцінки однорідності сукупності. Існує оціночний критерій — сукупність одно­рідна і середня величина в ній є типовою, якщо коефіцієнт варіації не перевищує 33 %.

 

Питання та завдання для самоконтролю

1. Дайте визначення поняття середньої величини.

2. Назвіть види середніх величин, які використовуються у правовій статис­тиці.

3. Поясніть формулу обчислення середньої арифметичної.

4. Дайте визначення поняття моди і медіани та наведіть приклади їх вико­ристання в правовій статистиці.

5. Розкрийте зміст показників варіації статистичної сукупності: розмах ва­ріації, середнє лінійне та середнє квадратичне відхилення, коефіцієнт варіації.

 

Завдання 1. Працівниками органу досудового слідства було розслідувано в строк до 1 місяця 420 кримінальних справ; у строк від 1 до 2 місяців — 632 справи; у строк від 2 до 3 місяців — 75 справ; у строк понад 3 місяці — 15 справ. Визначте середній строк до- судового слідства і вкажіть, який різновид середньої величини Вами застосовано і чому.

Завдання 2. Визначте середньомісячне навантаження на одного слідчого, якщо у відділі, де за штатним розкладом 22 слідчих, перебувало у провадженні: у січні — 160 справ, у лютому — 175 справ, у бе­резні — 188 справ, у квітні — 155 справ, у травні — 182 справи, у червні — 190 справ. Укажіть, який вид середньої величини Вами обчислено і чому.