Розділ ІХ Основні положення теорії імовірностей та вибіркового спостереження

Учебные материалы - Правова статистика (В.В. Голіна)

Розділ ІХ Основні положення теорії імовірностей та вибіркового спостереження

§ 1. Поняття теорії імовірності, закону великих чисел, динамічних і статистичних закономірностей

Кожна людина неодноразово у своїй професійній діяльності чи повсякденному житті ставить перед собою питання: які наслідки може спричинити певна діяльність; чи відбудеться та чи інша подія; як зробити прогноз її настання і т. п.

Прогнозування здійснюється не лише окремою людиною, а і в процесі роботи державних і недержавних органів та є підставою для прийняття рішень. Зокрема, у ч. 2 ст. 1 Закону України «Про державне прогнозування та розроблення програм економічного і соціального розвитку України» від 23. 03. 2000 р. № 1602-III зазначено: «Прогноз економічного і соціального розвитку є засобом обґрунтування вибору тієї чи іншої стратегії та прийняття конкретних рішень органами законодавчої та виконавчої влади, органами місцевого самоврядування щодо регулювання соціально-економічних процесів». І це є лише одиничним прикладом застосування прогнозів. Для того щоб грамотно побудувати прогнози, необхідно керуватися основними категоріями та законами, такими як теорія імовірностей, закон великих чисел, поняття події (достовірної, неможливої, імовірнісної), закономірності (статистичної та динамічної) тощо.

В юриспруденції часто зустрічається прогностична та аналітична діяльність. Однак не можна не зважати на те, що будь-який прогноз, передбачення має імовірнісний характер, якусь похибку. Мета ж дослідника — зробити її мінімальною, а прогноз — максимально достовірним.

Одним із важливіших понять, яким керується теорія імовірностей^{^[1]}, є поняття події. Зрозуміло, що вона не виникає сама по собі, а є результатом впливу певних факторів, серед яких, наприклад, причини та умови вчинення злочину, причини настання смерті, причини зростання цін чи податків, передумови стихійного лиха і т. ін. Тут подіями є саме злочин, смерть, зростання цін, стихійне лихо. Досліджуючи передумови, іноді можна впевнено сказати, що при поєднанні факторів подія відбудеться обов’язково. Так, при нагріванні води до 100° починається процес кипіння, де кипіння — це подія, а нагрівання — фактор її настання. Отже, подія вважається достовірною в разі її 100- відсоткового настання при поєднанні факторів, які спричиняють до неї. Вона так само може бути і неможливою, скажімо, при нагріванні води лише до 40° (унаслідок чого кипіння неможливе).

Утім не завжди сукупність факторів обов’язково приведе до настання події. Наприклад, наявність умислу на вчинення крадіжки, перебування потенційного злочинця в транспорті в години пік, необачна поведінка потенційної жертви (залишення без нагляду гаманця, який стирчить із сумки) як фактори, що можуть спричинити вчинення злочину, не завжди призводять до цього. Завадити викраденню може жалість до жертви, зміна її поведінки або раптове втручання сторонньої людини тощо.

Узагалі вчинення конкретного злочину окремою людиною є унікальною подією через неповторність особистості. І це є крайнім прикладом випадкової одиничної події, прогнозувати яку дуже важко. Однак зробити більш достовірний прогноз можна стосовно інших подій. Прикладами випадкових подій є вчинення злочинів певної групи (зокрема, необережних чи деяких насильницьких) особами окремої вікової категорії. Отже, якщо при комплексі факторів подія може відбутися або не відбутися, вона має назву випадкової. Наука, яка вивчає закономірності масових випадкових явищ, і називається теорією імовірностей.

Застосовувати теорію імовірності доцільно в умовах, коли дослідник об’єктивно не може побачити розвиток явища чи його причини. Одне з основних понять теорії імовірності — це імовірність. Класичне визначення імовірності таке: імовірність випадкової події дорівнює відношенню числа випадків, які сприяють події, до спільного числа можливих випадків. Інакше кажучи, для значної кількості випадків імовірність характеризує частоту події. Кількісна міра означає, наскільки у кількісному відношенні (скажімо, у відсотках від 0-1 до 100 % чи в балах від 0-1 до 10) можливе настання тієї чи іншої події. (Відповідно при значенні 0 — настання події є однозначно неможливим; при значенні 100 % або 10 — достовірним, а решта значень свідчать про більшу чи меншу імовірність настання події).

Характерною ознакою поняття імовірності є тріада «кількість — подія — невизначеність». Сам факт невизначеності говорить про те, що достовірно не відомо: чи матиме місце певна подія. Класичне визначення імовірності дозволяє обрахувати числове вираження настання випадкової події за допомогою відношення кількості випадків, сприяючих події, до загальної кількості можливих випадків. Імовірність характеризує частоту тієї чи іншої події в загальній кількості подій, що дає можливість передбачення.

Наступним важливим поняттям є закон великих чисел. Згідно з ним, сукупність великої кількості однорідних випадкових фактів набуває якостей, розвиток яких можна передбачити на підставі теорії імовірностей, оскільки ця сукупність утворила нове, зокрема, соціальне явище.

Використовуючи цей закон, а також поняття імовірності, поставимо питання: яка вірогідність того, що в разі наявності причин та умов вчинення зґвалтування, воно буде вчинено щодо особи у віці від 13 до 23 років або від 24 до 33 років? Заздалегідь цього сказати не можна, тому що вчинення суспільно небезпечного діяння проти окремої особи за наявності конкретних причин та умов є випадковим (на місці конкретної потерпілої особи могла б бути інша з таким самим поєднанням детермінуючих чинників). Це є проявом того, що окрема подія в межах дії закону великих чисел може зовсім не відповідати очікуванням, бо імовірною є наявність осіб, які стали потерпілими від вчинення зґвалтувань, віком набагато молодше 13-ти і набагато старше 33-х років. Тож, для відповіді на поставлене вище питання ми з усіх розрізнених випадків зґвалтування досліджуємо їх значну кількість (події мають відбутися протягом фіксованого терміну, скажімо, за 5 років) і одержуємо результат, який майже не змінюється протягом доволі тривалого періоду часу. Так, жертвами зґвалтування найчастіше (у 65 %) стають жінки та дівчата у віці від 13 до 23 років, а у віці від 24 до 33 — всього 15 %. Іншими словами, імовірність вчинення вказаного злочину до особи у віці від 13 до 23 років складає 63 %. Подібні цифри неможливо побачити внаслідок узагальнення кількох одиниць. Ми маємо проникнути до самої сутності соціального явища, яке завжди є чисельним. Отримані таким чином результати обов’язково аналізуються, винаходяться причини саме цього суспільного явища. Повторимося, матеріал для цього аналізу одержується не одиничним відбиранням випадкових подій, а саме системним підбором їх великої кількості, які в сукупності складуть закономірність згідно із законом великих чисел.

Закон великих чисел є важливим методологічним підґрунтям вибіркового спостереження.

Використання закону великих чисел, теорії імовірностей може стати науковою основою прогнозування, а сам факт передбачення, прогнозу має бути заснованим не на екстрасенсорних якостях індивіда, а на використанні ним певних закономірностей. Загалом закономірність — це необхідний, істотний, постійно повторюваний взаємозв’язок явищ реального світу, який визначає етапи і форми процесу становлення, розвитку явищ природи, суспільства. Розрізняють два види закономірностей: динамічну та статистичну.

Динамічна закономірність — це закономірність, яка виражає однозначні причинно-наслідкові зв’язки. Іншими словами, це форма причинного зв’язку, а також постійного зв’язку, коли конкретний стан системи однозначно визначає всі її майбутні стани. Зважаючи на це знання початкових умов дає можливість точно передбачити подальший розвиток системи. Така закономірність притаманна фізичним, хімічним, біологічним, математичним явищам.

Статистична закономірність — це така закономірність, яка проявляється в масі однорідних явищ при узагальненні даних статистичної сукупності і заснована на дії закону великих чисел. Це форма причинного зв’язку, при якому конкретний стан системи визначає весь її подальший стан не однозначно, а лише з певною мірою вірогідності. Така закономірність притаманна суспільним явищам.

Із наведених визначень видно, що статистична закономірність, заснована на законі великих чисел, теорії імовірностей, може бути покладена в основу вибіркового спостереження.

§ 2. Основні положення вибіркового спостереження та його значення для вивчення правових явищ

При аналізі конкретного соціального явища необхідно отримати інформацію про нього. З наведеного прикладу про вік жертв зґвалтування видно, що ми досліджували не всіх жертв, а лише їх частину. Для того щоб відібрана сукупність відображала основні якості всього явища, вона має бути побудована за конкретними законами, де основними категоріями є: вибірка (вибіркова сукупність), генеральна сукупність, репрезентативність, похибка репрезентативності, одиниця сукупності, способи побудови вибірки та ін.

Особливості вибіркового спостереження полягають у такому:

1) при одержанні висновків використовується математика, її закони;

2) дає можливість значно швидше і з меншими витратами часу та грошей отримати результат, вивчаючи не весь масив подій, а лише їх частину; 3) може бути застосоване для вивчення різних об’єктів: від конкретних питань (наприклад, вік, стать засуджених) до вивчення громадської думки чи рівня матеріального забезпечення населення.

Вибіркове спостереження — це таке статистичне спостереження, при якому дослідженню піддається не вся сукупність, що вивчається, а лише деяка, відібрана певним чином її частина, а отримані результати вивчення цієї частини поширюються на всю сукупність.

Ця частина називається вибірковою сукупністю, або вибіркою. Грамотно створена вибірка має складати зменшений макет усієї (генеральної) сукупності. Усі одиниці сукупності називаються генеральною сукупністю. Указане поняття має два різновиди: визначена генеральна сукупність (коли її чисельність точно відома) і невизначена.

Для вивчення генеральної сукупності необхідно з’ясувати, за допомогою якого методу її досліджувати: суцільного (вивчення всіх одиниць) чи вибіркового спостереження. Останнє застосовується в разі, коли: 1) генеральна сукупність об’єктивно не може бути повністю досліджена. Наприклад, для виявлення відсотка недоброякісної продукції, скажімо кондитерських виробів, можна відправити на харчову експертизу їх відповідну частину, а не всю партію; 2) суцільне дослідження є недоцільним. Зокрема, при вивченні добросовісності складання процесуальних документів слідчими МВС навряд чи варто вивчати сотні тисяч матеріалів, які ними складаються; 3) обсяг генеральної сукупності є настільки великим, що вивчити всі одиниці є або фізично неможливим, або занадто трудомістким. Наприклад, йдеться про з’ясування соціально-демографічних ознак осіб, які вчинили злочини (вік, стать, освіта, рід занять тощо): в Україні за 2007 р. зареєстровано 401 293 злочини, з них особи встановлені у 273 991 випадку. Тут явно необхідно брати певну частину наведеної сукупності.

Однак виникає запитання: якою саме має бути ця частина? Основною ознакою цієї частини генеральної сукупності, тобто вибірки, є її репрезентативність. Іншими словами, вибірка є репрезентативною, якщо її основні характеристики збігаються з основними характеристиками генеральної сукупності. Для досягнення вказаного необхідно виконати такі альтернативні дії: 1) взяти не менше 20 % генеральної сукупності, якщо ця кількість є можливою для обробки (не є занадто великою); 2) у разі недоцільності обробки 20 % генеральної сукупності можливим є вивчення одиниць сукупності в кількості не менше 100*;

3) визначення обсягу вибіркової сукупності за формулою, яка розглядатиметься наприкінці цього параграфа.

Головною характеристикою якості обраної вибірки є поняття похибки репрезентативності. Похибка репрезентативності — це певні розбіжності між показниками вибіркового та суцільного спостереження.

За обсягом похибки репрезентативності ділять на надійну, звичайну та наближену. Інакше кажучи, допустимою є похибка в розмірі до 3 %, від 3 до 10 % та від 10 до 20 % відповідно, хоча у правовій статистиці бажано, щоб її розмір не перевищував 5-6 %. У противному разі є підстави говорити про недостатню репрезентативність вибірки.

Для обчислення похибки репрезентативності та того, як вона впливає на вибіркову чи генеральну сукупність, застосовуються позначення показників, наведені в табл. 5.

* В усіх таблицях для спрощеного розрахунку величини похибки кількість спостережень наводиться виходячи з цієї кількості.

Середня в генеральній сукупності відрізняється від середньої у вибірковій сукупності на величину похибки репрезентативності:

де А — похибка репрезентативності.

Наприклад, після проведення вибіркового спостереження з’ясувалось, що середній вік частки осіб, що були засуджені і нами досліджені, дорівнює 25 рокам (~ ). Розрахована похибка репрезентативності (А) становить ± 5 %, тобто — 1,25 року (32 х 5 %, або 32 х 0,05 = 1,25). Відповідно до наведеної формули середній вік засуджених у всій сукупності (25,0 ± 1,25) коливатиметься в межах від 23,75 до 26,25 року. Таким чином, ми вирішили головне завдання вибіркового спостереження — за здобутими нами вибірковими показниками (одержаними внаслідок проведеного дослідження) з’ясувати, чому дорівнюватимуть відповідні показники генеральної сукупності, які нам не відомі.

Згідно з теоремою П. Чебишева, з уточненнями О. Ляпунова в математиці було доведено, що при достатньо великій кількості обстежених одиниць сукупності середня величина досліджуваної ознаки у вибірковій сукупності відрізнятиметься від середньої величини в генеральній сукупності на величину

де А — гранична похибка вибірки, тобто похибка репрезентативності; f — середня похибка вибірки; t — коефіцієнт, що залежить від імовірності, з якою можна гарантувати певний розмір похибки репрезентативності. Якщо t = 0, то імовірність також дорівнює 0; якщо t = 0,5, то імовірність дорівнює 0,383, або 38,3 %; якщо t = 1, то імовірність дорівнює 0,683, або 68,3 %; якщо t = 2, то імовірність дорівнює 0,954, або 95,4 %; якщо t = 3, то імовірність дорівнює 0,997, або 99,7 %; якщо t = 4, то імовірність дорівнює 0,999936 і т. п. При цьому слід врахувати, що даний коефіцієнт може приймати не тільки цілі, але й дробові значення (інші умовні позначення містяться у табл. 5).

Із наведеної формули випливає, що похибка репрезентативності залежить від багатьох чинників: 1) імовірності, з якою ми бажаємо одержати результат; 2) чисельності одиниць вибіркової сукупності (чим менше одиниць складатиме вибіркова сукупність, тим більшою буде похибка репрезентативності, і навпаки); 3) однорідності досліджуваної сукупності (чим більш різнорідною є сукупність, тим більшою буде похибка репрезентативності), і 4) від способу відбору одиниць у вибіркову сукупність.

Як правило, при проведенні вибіркового спостереження перед дослідником для успішного його проведення необхідно поставити два взаємозв’язаних завдання: 1) визначення необхідної кількості одиниць вибіркової сукупності, тобто скільки одиниць обстежуватиметься (причому вибірка має бути репрезентативною); 2) розрахунок похибки репрезентативності зі встановленим рівнем імовірності.

Багаторічна практика свідчить, що довірча імовірність 95,4 (для t = 1) є оптимальною для більшості розрахунків у різних галузях господарства, тим більше для правових явищ. Тому для полегшення досить громіздких розрахунків похибки вибіркового спостереження існують спеціальні таблиці, застосовуючи які, можна визначити або величину похибки репрезентативності при певній кількості спостережень із довірчою імовірністю 95,4 %, або кількість вибіркових спостережень при заданій величині похибки репрезентативності з довірчою імовірністю

95,4 % без використання вищенаведеної формули[2]. Якщо таблиці відсутні, то в цьому випадку всі розрахунки необхідно проводити на базі раніш наведеної формули.

При визначенні обсягу вибірки необхідно виходити з умов наявності заданої величини похибки репрезентативності. Перетворивши попередню формулу, оптимальний розмір вибірки складе

де n — обсяг вибіркової сукупності; w — частина одиниць, які мають дану ознаку; t — коефіцієнт, квадрат якого гарантує вірогідність довірчого інтервалу. Квадрат цього коефіцієнта, що, як зазначалося, гарантує імовірність 95,4, дорівняє 4; А — похибка репрезентативності.

У конкретно-правових дослідженнях відсоток похибки середнього значення зазвичай задається самим дослідником на основі програми спостереження і відповідно до даних раніше проведених досліджень. Як правило, вважається допустимою гранична похибка вибірки (похибка репрезентативності) в межах 3-5 %.

Також варто пам’ятати, що головне при організації вибіркового спостереження — це доведення його обсягу до допустимого мінімуму. При цьому не слід прагнути до надмірного зменшення меж похибки вибірки, бо це може призвести до невиправданого збільшення обсягу вибірки і, отже, до підвищення витрат на проведення вибіркового спостереження. У той же час не можна і надмірно збільшувати розмір похибки репрезентативності, оскільки в цьому випадку хоча і відбудеться зменшення обсягу вибіркової сукупності, але це призведе до погіршення достовірності одержаних результатів.

§ 3. Способи відбору одиниць у вибіркову сукупність

Не кожна вибірка є репрезентативною. Іноді одна і та сама ознака по-різному виражена в цілому і в її частині. Для досягнення вимог репрезентативності доцільним є використання різних прийомів створення вибірки. Причому використання того чи іншого прийому (способу) залежить від конкретних обставин. Серед таких прийомів (способів) створення вибірки вирізняють: 1) випадковий відбір; 2) механічний відбір; 3) типовий відбір; 4) серійний (гніздовий) відбір.

Випадковий відбір являє собою систему заходів, спрямованих на випадкове відбирання одиниць сукупності, коли вірогідність потрапити до вибірки є рівною для всіх одиниць генеральної сукупності. Цей прийом доцільно застосовувати лише в разі однорідності останньої та невеликої кількості притаманних їй ознак. У противному разі деякі характерні риси ризикують бути не відображеними у вибірці.

Ознаки випадкового відбору лежать в основі всіх інших способів побудови вибірки.

При механічному відборі відбір одиниць проводиться механічно через певний інтервал. Якщо необхідно сформувати вибірку конкретних злочинів, можна вилучати з усіх карток статистичного обліку на зареєстрований злочин кожну 5-ту, 10-ту або 15-ту картку залежно від їх загальної кількості і наявних розмірів вибірки. Недоліком цього способу є те, що перед відбором необхідно мати повий облік одиниць сукупності, потім потрібно провести ранжування і лише після цього можна проводити вибірку з певним інтервалом.

Типовий (районований) відбір — це така відбір, при якому генеральну сукупність поділяють на однорідні групи за певною ознакою (або на райони і зони). Потім з кожної групи у випадковому порядку відбирається певна кількість одиниць пропорційно питомій вазі групи в загальній сукупності. Типовий відбір часто здійснюється в декілька етапів.

Серійна відбір — це така відбір, при якому відбір одиниць проводиться групами (серіями) і обстеженню підлягають усі одиниці відібраної групи (серії). Перевагою серійного відбору є те, що інколи відібрати окремі одиниці складніше, ніж серії, наприклад, при вивченні особи, яка відбуває покарання. У межах відібраних районів, зон або серій застосовується вивчення всіх одиниць без винятку (наприклад, вивчення всіх осіб, що відбувають покарання в даному закладі).

Саме від правильності складення вибіркової сукупності з урахуванням вимоги її репрезентативності, обсягу похибки репрезентативності, закону великих чисел, теорії імовірностей залежатиме достовірність результатів дослідження.

Питання та завдання для самоконтролю

1. Дайте характеристику теорії імовірностей, закону великих чисел, опишіть їх взаємозв’язок.

2. Що таке закономірність, які вона має види? Який із видів закономірності застосовується у правовій статистиці, чому?

3. У чому полягає метод вибіркового спостереження? Які його основні категорії? Дайте їх характеристику.

4. Що таке похибка репрезентативності? Розкрийте сутність цього поняття, які чинники впливають на неї?

5. Яким має бути обсяг вибіркової сукупності?

6. Які Ви знаєте способи відбору одиниць до вибіркової сукупності?

Завдання 1. Обчисліть, якою повинна бути чисельність вибіркової сукупності при встановленні частки засуджених за тяжкі злочини, щоб похибка репрезентативності дорівнювала ± 3 % з імовірністю 95,4 %? (Вважаємо, що питома вага цих злочинів в області становить 40 %.)

Завдання 2. З метою вивчення громадської думки щодо роботи правоохоронних органів шляхом механічного відбору було опитано 1500 осіб, що становить 1 % від загальної кількості населення. 340 осіб позитивно оцінили роботу правоохоронних органів. Визначте частку осіб, які позитивно оцінюють роботу правоохоронних органів, серед усього населення.

^{^[1]} Теорія імовірностей—це розділ математики, в якому вивчаються тільки випадкові явища (події) зі стійкою частотою і встановлюються закономірності при масовому повторенні.

[2] Див.: Боярский А. Я. Таблицьі для определения достоверности статистических показателей и числа наблюдений в статистическом исследовании / Боярский А. Я. - М., 1947.