Розділ ІХ Основні положення теорії імовірностей та вибіркового спостереження Печать
Рейтинг пользователей: / 0
ХудшийЛучший 
Учебные материалы - Правова статистика (В.В. Голіна)

Розділ ІХ Основні положення теорії імовірностей та вибіркового спостереження

 

§ 1. Поняття теорії імовірності, закону великих чисел, динамічних і статистичних закономірностей

Кожна людина неодноразово у своїй професійній діяльності чи повсякденному житті ставить перед собою питання: які наслідки може спричинити певна діяльність; чи відбудеться та чи інша подія; як зро­бити прогноз її настання і т. п.

Прогнозування здійснюється не лише окремою людиною, а і в про­цесі роботи державних і недержавних органів та є підставою для при­йняття рішень. Зокрема, у ч. 2 ст. 1 Закону України «Про державне прогнозування та розроблення програм економічного і соціального розвитку України» від 23. 03. 2000 р. № 1602-III зазначено: «Прогноз економічного і соціального розвитку є засобом обґрунтування вибору тієї чи іншої стратегії та прийняття конкретних рішень органами за­конодавчої та виконавчої влади, органами місцевого самоврядування щодо регулювання соціально-економічних процесів». І це є лише оди­ничним прикладом застосування прогнозів. Для того щоб грамотно побудувати прогнози, необхідно керуватися основними категоріями та законами, такими як теорія імовірностей, закон великих чисел, поняття події (достовірної, неможливої, імовірнісної), закономірності (ста­тистичної та динамічної) тощо.

В юриспруденції часто зустрічається прогностична та аналітична діяльність. Однак не можна не зважати на те, що будь-який прогноз, передбачення має імовірнісний характер, якусь похибку. Мета ж до­слідника — зробити її мінімальною, а прогноз — максимально досто­вірним.

Одним із важливіших понять, яким керується теорія імовірностей[1], є поняття події. Зрозуміло, що вона не виникає сама по собі, а є резуль­татом впливу певних факторів, серед яких, наприклад, причини та умови вчинення злочину, причини настання смерті, причини зростан­ня цін чи податків, передумови стихійного лиха і т. ін. Тут подіями є саме злочин, смерть, зростання цін, стихійне лихо. Досліджуючи передумови, іноді можна впевнено сказати, що при поєднанні факторів подія відбудеться обов’язково. Так, при нагріванні води до 100° по­чинається процес кипіння, де кипіння — це подія, а нагрівання — фак­тор її настання. Отже, подія вважається достовірною в разі її 100- відсоткового настання при поєднанні факторів, які спричиняють до неї. Вона так само може бути і неможливою, скажімо, при нагріванні води лише до 40° (унаслідок чого кипіння неможливе).

Утім не завжди сукупність факторів обов’язково приведе до на­стання події. Наприклад, наявність умислу на вчинення крадіжки, перебування потенційного злочинця в транспорті в години пік, нео­бачна поведінка потенційної жертви (залишення без нагляду гаманця, який стирчить із сумки) як фактори, що можуть спричинити вчинення злочину, не завжди призводять до цього. Завадити викраденню може жалість до жертви, зміна її поведінки або раптове втручання сторонньої людини тощо.

Узагалі вчинення конкретного злочину окремою людиною є уні­кальною подією через неповторність особистості. І це є крайнім при­кладом випадкової одиничної події, прогнозувати яку дуже важко. Однак зробити більш достовірний прогноз можна стосовно інших по­дій. Прикладами випадкових подій є вчинення злочинів певної групи (зокрема, необережних чи деяких насильницьких) особами окремої вікової категорії. Отже, якщо при комплексі факторів подія може від­бутися або не відбутися, вона має назву випадкової. Наука, яка вивчає закономірності масових випадкових явищ, і називається теорією імо­вірностей.

Застосовувати теорію імовірності доцільно в умовах, коли дослід­ник об’єктивно не може побачити розвиток явища чи його причини. Одне з основних понять теорії імовірності — це імовірність. Класич­не визначення імовірності таке: імовірність випадкової події дорівнює відношенню числа випадків, які сприяють події, до спільного числа можливих випадків. Інакше кажучи, для значної кількості випадків імовірність характеризує частоту події. Кількісна міра означає, на­скільки у кількісному відношенні (скажімо, у відсотках від 0-1 до 100 % чи в балах від 0-1 до 10) можливе настання тієї чи іншої події. (Від­повідно при значенні 0 — настання події є однозначно неможливим; при значенні 100 % або 10 — достовірним, а решта значень свідчать про більшу чи меншу імовірність настання події).

Характерною ознакою поняття імовірності є тріада «кількість — подія — невизначеність». Сам факт невизначеності говорить про те, що достовірно не відомо: чи матиме місце певна подія. Класичне ви­значення імовірності дозволяє обрахувати числове вираження настан­ня випадкової події за допомогою відношення кількості випадків, сприяючих події, до загальної кількості можливих випадків. Імовірність характеризує частоту тієї чи іншої події в загальній кількості подій, що дає можливість передбачення.

Наступним важливим поняттям є закон великих чисел. Згідно з ним, сукупність великої кількості однорідних випадкових фактів набуває якос­тей, розвиток яких можна передбачити на підставі теорії імовірностей, оскільки ця сукупність утворила нове, зокрема, соціальне явище.

Використовуючи цей закон, а також поняття імовірності, поставимо питання: яка вірогідність того, що в разі наявності причин та умов вчи­нення зґвалтування, воно буде вчинено щодо особи у віці від 13 до 23 років або від 24 до 33 років? Заздалегідь цього сказати не можна, тому що вчинення суспільно небезпечного діяння проти окремої особи за наявності конкретних причин та умов є випадковим (на місці конкретної потерпілої особи могла б бути інша з таким самим поєднанням детермі­нуючих чинників). Це є проявом того, що окрема подія в межах дії за­кону великих чисел може зовсім не відповідати очікуванням, бо імовір­ною є наявність осіб, які стали потерпілими від вчинення зґвалтувань, віком набагато молодше 13-ти і набагато старше 33-х років. Тож, для відповіді на поставлене вище питання ми з усіх розрізнених випадків зґвалтування досліджуємо їх значну кількість (події мають відбутися протягом фіксованого терміну, скажімо, за 5 років) і одержуємо резуль­тат, який майже не змінюється протягом доволі тривалого періоду часу. Так, жертвами зґвалтування найчастіше (у 65 %) стають жінки та ді­вчата у віці від 13 до 23 років, а у віці від 24 до 33 — всього 15 %. Інши­ми словами, імовірність вчинення вказаного злочину до особи у віці від 13 до 23 років складає 63 %. Подібні цифри неможливо побачити вна­слідок узагальнення кількох одиниць. Ми маємо проникнути до самої сутності соціального явища, яке завжди є чисельним. Отримані таким чином результати обов’язково аналізуються, винаходяться причини саме цього суспільного явища. Повторимося, матеріал для цього аналізу одержується не одиничним відбиранням випадкових подій, а саме сис­темним підбором їх великої кількості, які в сукупності складуть законо­мірність згідно із законом великих чисел.

Закон великих чисел є важливим методологічним підґрунтям ви­біркового спостереження.

Використання закону великих чисел, теорії імовірностей може стати науковою основою прогнозування, а сам факт передбачення, прогнозу має бути заснованим не на екстрасенсорних якостях індивіда, а на використанні ним певних закономірностей. Загалом закономір­ність — це необхідний, істотний, постійно повторюваний взаємозв’язок явищ реального світу, який визначає етапи і форми процесу становлен­ня, розвитку явищ природи, суспільства. Розрізняють два види законо­мірностей: динамічну та статистичну.

Динамічна закономірність — це закономірність, яка виражає одно­значні причинно-наслідкові зв’язки. Іншими словами, це форма при­чинного зв’язку, а також постійного зв’язку, коли конкретний стан системи однозначно визначає всі її майбутні стани. Зважаючи на це знання початкових умов дає можливість точно передбачити подальший розвиток системи. Така закономірність притаманна фізичним, хіміч­ним, біологічним, математичним явищам.

Статистична закономірність — це така закономірність, яка про­являється в масі однорідних явищ при узагальненні даних статистичної сукупності і заснована на дії закону великих чисел. Це форма причин­ного зв’язку, при якому конкретний стан системи визначає весь її по­дальший стан не однозначно, а лише з певною мірою вірогідності. Така закономірність притаманна суспільним явищам.

Із наведених визначень видно, що статистична закономірність, за­снована на законі великих чисел, теорії імовірностей, може бути по­кладена в основу вибіркового спостереження.


§ 2. Основні положення вибіркового спостереження та його значення для вивчення правових явищ

При аналізі конкретного соціального явища необхідно отримати інформацію про нього. З наведеного прикладу про вік жертв зґвалту­вання видно, що ми досліджували не всіх жертв, а лише їх частину. Для того щоб відібрана сукупність відображала основні якості всього явища, вона має бути побудована за конкретними законами, де осно­вними категоріями є: вибірка (вибіркова сукупність), генеральна су­купність, репрезентативність, похибка репрезентативності, одиниця сукупності, способи побудови вибірки та ін.

Особливості вибіркового спостереження полягають у такому:

1)  при одержанні висновків використовується математика, її закони;

2)  дає можливість значно швидше і з меншими витратами часу та гро­шей отримати результат, вивчаючи не весь масив подій, а лише їх частину; 3) може бути застосоване для вивчення різних об’єктів: від конкретних питань (наприклад, вік, стать засуджених) до вивчення громадської думки чи рівня матеріального забезпечення населення.

Вибіркове спостереження — це таке статистичне спостереження, при якому дослідженню піддається не вся сукупність, що вивчається, а лише деяка, відібрана певним чином її частина, а отримані результа­ти вивчення цієї частини поширюються на всю сукупність.

Ця частина називається вибірковою сукупністю, або вибіркою. Грамотно створена вибірка має складати зменшений макет усієї (гене­ральної) сукупності. Усі одиниці сукупності називаються генеральною сукупністю. Указане поняття має два різновиди: визначена генеральна сукупність (коли її чисельність точно відома) і невизначена.

Для вивчення генеральної сукупності необхідно з’ясувати, за до­помогою якого методу її досліджувати: суцільного (вивчення всіх одиниць) чи вибіркового спостереження. Останнє застосовується в разі, коли: 1) генеральна сукупність об’єктивно не може бути повністю до­сліджена. Наприклад, для виявлення відсотка недоброякісної продук­ції, скажімо кондитерських виробів, можна відправити на харчову експертизу їх відповідну частину, а не всю партію; 2) суцільне дослі­дження є недоцільним. Зокрема, при вивченні добросовісності складан­ня процесуальних документів слідчими МВС навряд чи варто вивчати сотні тисяч матеріалів, які ними складаються; 3) обсяг генеральної сукупності є настільки великим, що вивчити всі одиниці є або фізично неможливим, або занадто трудомістким. Наприклад, йдеться про з’ясування соціально-демографічних ознак осіб, які вчинили злочини (вік, стать, освіта, рід занять тощо): в Україні за 2007 р. зареєстровано 401 293 злочини, з них особи встановлені у 273 991 випадку. Тут явно необхідно брати певну частину наведеної сукупності.

Однак виникає запитання: якою саме має бути ця частина? Осно­вною ознакою цієї частини генеральної сукупності, тобто вибірки, є її репрезентативність. Іншими словами, вибірка є репрезентативною, якщо її основні характеристики збігаються з основними характерис­тиками генеральної сукупності. Для досягнення вказаного необхідно виконати такі альтернативні дії: 1) взяти не менше 20 % генеральної сукупності, якщо ця кількість є можливою для обробки (не є занадто великою); 2) у разі недоцільності обробки 20 % генеральної сукупнос­ті можливим є вивчення одиниць сукупності в кількості не менше 100*;

3)  визначення обсягу вибіркової сукупності за формулою, яка розгля­датиметься наприкінці цього параграфа.

Головною характеристикою якості обраної вибірки є поняття похибки репрезентативності. Похибка репрезентативності — це певні розбіжнос­ті між показниками вибіркового та суцільного спостереження.

За обсягом похибки репрезентативності ділять на надійну, звичайну та наближену. Інакше кажучи, допустимою є похибка в розмірі до 3 %, від 3 до 10 % та від 10 до 20 % відповідно, хоча у правовій статистиці бажано, щоб її розмір не перевищував 5-6 %. У противному разі є під­стави говорити про недостатню репрезентативність вибірки.

Для обчислення похибки репрезентативності та того, як вона впли­ває на вибіркову чи генеральну сукупність, застосовуються позначен­ня показників, наведені в табл. 5.

 

 

* В усіх таблицях для спрощеного розрахунку величини похибки кількість спостережень наводиться виходячи з цієї кількості.

Середня в генеральній сукупності відрізняється від середньої у ви­бірковій сукупності на величину похибки репрезентативності:

де А — похибка репрезентативності.

Наприклад, після проведення вибіркового спостереження з’ясувалось, що середній вік частки осіб, що були засуджені і нами досліджені, до­рівнює 25 рокам (~ ). Розрахована похибка репрезентативності (А) становить ± 5 %, тобто — 1,25 року (32 х 5 %, або 32 х 0,05 = 1,25). Від­повідно до наведеної формули середній вік засуджених у всій сукупнос­ті (25,0 ± 1,25) коливатиметься в межах від 23,75 до 26,25 року. Таким чином, ми вирішили головне завдання вибіркового спостереження — за здобутими нами вибірковими показниками (одержаними внаслідок про­веденого дослідження) з’ясувати, чому дорівнюватимуть відповідні показники генеральної сукупності, які нам не відомі.

Згідно з теоремою П. Чебишева, з уточненнями О. Ляпунова в ма­тематиці було доведено, що при достатньо великій кількості обстежених одиниць сукупності середня величина досліджуваної ознаки у вибір­ковій сукупності відрізнятиметься від середньої величини в генеральній сукупності на величину

 

де А — гранична похибка вибірки, тобто похибка репрезентатив­ності; f — середня похибка вибірки; t — коефіцієнт, що залежить від імовірності, з якою можна гарантувати певний розмір похибки репре­зентативності. Якщо t = 0, то імовірність також дорівнює 0; якщо t = 0,5, то імовірність дорівнює 0,383, або 38,3 %; якщо t = 1, то імовірність дорівнює 0,683, або 68,3 %; якщо t = 2, то імовірність дорівнює 0,954, або 95,4 %; якщо t = 3, то імовірність дорівнює 0,997, або 99,7 %; якщо t = 4, то імовірність дорівнює 0,999936 і т. п. При цьому слід врахувати, що даний коефіцієнт може приймати не тільки цілі, але й дробові зна­чення (інші умовні позначення містяться у табл. 5).

Із наведеної формули випливає, що похибка репрезентативності за­лежить від багатьох чинників: 1) імовірності, з якою ми бажаємо одер­жати результат; 2) чисельності одиниць вибіркової сукупності (чим менше одиниць складатиме вибіркова сукупність, тим більшою буде похибка репрезентативності, і навпаки); 3) однорідності досліджуваної сукупності (чим більш різнорідною є сукупність, тим більшою буде похибка репрезентативності), і 4) від способу відбору одиниць у ви­біркову сукупність.

Як правило, при проведенні вибіркового спостереження перед до­слідником для успішного його проведення необхідно поставити два взаємозв’язаних завдання: 1) визначення необхідної кількості одиниць вибіркової сукупності, тобто скільки одиниць обстежуватиметься (при­чому вибірка має бути репрезентативною); 2) розрахунок похибки репрезентативності зі встановленим рівнем імовірності.

Багаторічна практика свідчить, що довірча імовірність 95,4 (для t = 1)  є оптимальною для більшості розрахунків у різних галузях господар­ства, тим більше для правових явищ. Тому для полегшення досить громіздких розрахунків похибки вибіркового спостереження існують спеціальні таблиці, застосовуючи які, можна визначити або величину похибки репрезентативності при певній кількості спостережень із до­вірчою імовірністю 95,4 %, або кількість вибіркових спостережень при заданій величині похибки репрезентативності з довірчою імовірністю

95,4  % без використання вищенаведеної формули[2]. Якщо таблиці від­сутні, то в цьому випадку всі розрахунки необхідно проводити на базі раніш наведеної формули.

При визначенні обсягу вибірки необхідно виходити з умов наяв­ності заданої величини похибки репрезентативності. Перетворивши попередню формулу, оптимальний розмір вибірки складе

де n — обсяг вибіркової сукупності; w — частина одиниць, які мають дану ознаку; t — коефіцієнт, квадрат якого гарантує вірогід­ність довірчого інтервалу. Квадрат цього коефіцієнта, що, як зазна­чалося, гарантує імовірність 95,4, дорівняє 4; А — похибка репрезен­тативності.

У конкретно-правових дослідженнях відсоток похибки середнього значення зазвичай задається самим дослідником на основі програми спостереження і відповідно до даних раніше проведених досліджень. Як правило, вважається допустимою гранична похибка вибірки (по­хибка репрезентативності) в межах 3-5 %.

Також варто пам’ятати, що головне при організації вибіркового спостереження — це доведення його обсягу до допустимого мінімуму. При цьому не слід прагнути до надмірного зменшення меж похибки вибірки, бо це може призвести до невиправданого збільшення обсягу вибірки і, отже, до підвищення витрат на проведення вибіркового спо­стереження. У той же час не можна і надмірно збільшувати розмір по­хибки репрезентативності, оскільки в цьому випадку хоча і відбудеться зменшення обсягу вибіркової сукупності, але це призведе до погіршен­ня достовірності одержаних результатів.


§ 3. Способи відбору одиниць у вибіркову сукупність

Не кожна вибірка є репрезентативною. Іноді одна і та сама ознака по-різному виражена в цілому і в її частині. Для досягнення вимог репрезентативності доцільним є використання різних прийомів ство­рення вибірки. Причому використання того чи іншого прийому (спо­собу) залежить від конкретних обставин. Серед таких прийомів (спо­собів) створення вибірки вирізняють: 1) випадковий відбір; 2) меха­нічний відбір; 3) типовий відбір; 4) серійний (гніздовий) відбір.

Випадковий відбір являє собою систему заходів, спрямованих на випадкове відбирання одиниць сукупності, коли вірогідність потрапи­ти до вибірки є рівною для всіх одиниць генеральної сукупності. Цей прийом доцільно застосовувати лише в разі однорідності останньої та невеликої кількості притаманних їй ознак. У противному разі деякі характерні риси ризикують бути не відображеними у вибірці.

Ознаки випадкового відбору лежать в основі всіх інших способів побудови вибірки.

При механічному відборі відбір одиниць проводиться механічно через певний інтервал. Якщо необхідно сформувати вибірку конкрет­них злочинів, можна вилучати з усіх карток статистичного обліку на зареєстрований злочин кожну 5-ту, 10-ту або 15-ту картку залежно від їх загальної кількості і наявних розмірів вибірки. Недоліком цього способу є те, що перед відбором необхідно мати повий облік одиниць сукупності, потім потрібно провести ранжування і лише після цього можна проводити вибірку з певним інтервалом.

Типовий (районований) відбір — це така відбір, при якому гене­ральну сукупність поділяють на однорідні групи за певною ознакою (або на райони і зони). Потім з кожної групи у випадковому порядку відбирається певна кількість одиниць пропорційно питомій вазі групи в загальній сукупності. Типовий відбір часто здійснюється в декілька етапів.

Серійна відбір — це така відбір, при якому відбір одиниць прово­диться групами (серіями) і обстеженню підлягають усі одиниці віді­браної групи (серії). Перевагою серійного відбору є те, що інколи віді­брати окремі одиниці складніше, ніж серії, наприклад, при вивченні особи, яка відбуває покарання. У межах відібраних районів, зон або серій застосовується вивчення всіх одиниць без винятку (наприклад, вивчення всіх осіб, що відбувають покарання в даному закладі).

Саме від правильності складення вибіркової сукупності з ураху­ванням вимоги її репрезентативності, обсягу похибки репрезентатив­ності, закону великих чисел, теорії імовірностей залежатиме достовір­ність результатів дослідження.

 

Питання та завдання для самоконтролю

1. Дайте характеристику теорії імовірностей, закону великих чисел, опишіть їх взаємозв’язок.

2. Що таке закономірність, які вона має види? Який із видів закономірності застосовується у правовій статистиці, чому?

3. У чому полягає метод вибіркового спостереження? Які його основні ка­тегорії? Дайте їх характеристику.

4. Що таке похибка репрезентативності? Розкрийте сутність цього поняття, які чинники впливають на неї?

5. Яким має бути обсяг вибіркової сукупності?

6. Які Ви знаєте способи відбору одиниць до вибіркової сукупності?

 

Завдання 1. Обчисліть, якою повинна бути чисельність вибіркової сукупності при встановленні частки засуджених за тяжкі злочини, щоб по­хибка репрезентативності дорівнювала ± 3 % з імовірністю 95,4 %? (Вважаємо, що питома вага цих злочинів в області становить 40 %.)

Завдання 2. З метою вивчення громадської думки щодо роботи правоохоронних органів шляхом механічного відбору було опитано 1500 осіб, що становить 1 % від загальної кількості населення. 340 осіб пози­тивно оцінили роботу правоохоронних органів. Визначте частку осіб, які позитивно оцінюють роботу правоохоронних органів, серед усього населення.




[1] Теорія імовірностей—це розділ математики, в якому вивчаються тільки випадкові явища (події) зі стійкою частотою і встановлюються закономірності при масовому повторенні.

[2] Див.: Боярский А. Я. Таблицьі для определения достоверности статистических показателей и числа наблюдений в статистическом исследовании / Боярский А. Я. - М., 1947.