Розділ ІХ Основні положення теорії імовірностей та вибіркового спостереження - § 2. Основні положення вибіркового спостереження та його значення для вивчення правових явищ
§ 2. Основні положення вибіркового спостереження та його значення для вивчення правових явищ
При аналізі конкретного соціального явища необхідно отримати інформацію про нього. З наведеного прикладу про вік жертв зґвалтування видно, що ми досліджували не всіх жертв, а лише їх частину. Для того щоб відібрана сукупність відображала основні якості всього явища, вона має бути побудована за конкретними законами, де основними категоріями є: вибірка (вибіркова сукупність), генеральна сукупність, репрезентативність, похибка репрезентативності, одиниця сукупності, способи побудови вибірки та ін.
Особливості вибіркового спостереження полягають у такому:
1) при одержанні висновків використовується математика, її закони;
2) дає можливість значно швидше і з меншими витратами часу та грошей отримати результат, вивчаючи не весь масив подій, а лише їх частину; 3) може бути застосоване для вивчення різних об’єктів: від конкретних питань (наприклад, вік, стать засуджених) до вивчення громадської думки чи рівня матеріального забезпечення населення.
Вибіркове спостереження — це таке статистичне спостереження, при якому дослідженню піддається не вся сукупність, що вивчається, а лише деяка, відібрана певним чином її частина, а отримані результати вивчення цієї частини поширюються на всю сукупність.
Ця частина називається вибірковою сукупністю, або вибіркою. Грамотно створена вибірка має складати зменшений макет усієї (генеральної) сукупності. Усі одиниці сукупності називаються генеральною сукупністю. Указане поняття має два різновиди: визначена генеральна сукупність (коли її чисельність точно відома) і невизначена.
Для вивчення генеральної сукупності необхідно з’ясувати, за допомогою якого методу її досліджувати: суцільного (вивчення всіх одиниць) чи вибіркового спостереження. Останнє застосовується в разі, коли: 1) генеральна сукупність об’єктивно не може бути повністю досліджена. Наприклад, для виявлення відсотка недоброякісної продукції, скажімо кондитерських виробів, можна відправити на харчову експертизу їх відповідну частину, а не всю партію; 2) суцільне дослідження є недоцільним. Зокрема, при вивченні добросовісності складання процесуальних документів слідчими МВС навряд чи варто вивчати сотні тисяч матеріалів, які ними складаються; 3) обсяг генеральної сукупності є настільки великим, що вивчити всі одиниці є або фізично неможливим, або занадто трудомістким. Наприклад, йдеться про з’ясування соціально-демографічних ознак осіб, які вчинили злочини (вік, стать, освіта, рід занять тощо): в Україні за 2007 р. зареєстровано 401 293 злочини, з них особи встановлені у 273 991 випадку. Тут явно необхідно брати певну частину наведеної сукупності.
Однак виникає запитання: якою саме має бути ця частина? Основною ознакою цієї частини генеральної сукупності, тобто вибірки, є її репрезентативність. Іншими словами, вибірка є репрезентативною, якщо її основні характеристики збігаються з основними характеристиками генеральної сукупності. Для досягнення вказаного необхідно виконати такі альтернативні дії: 1) взяти не менше 20 % генеральної сукупності, якщо ця кількість є можливою для обробки (не є занадто великою); 2) у разі недоцільності обробки 20 % генеральної сукупності можливим є вивчення одиниць сукупності в кількості не менше 100*;
3) визначення обсягу вибіркової сукупності за формулою, яка розглядатиметься наприкінці цього параграфа.
Головною характеристикою якості обраної вибірки є поняття похибки репрезентативності. Похибка репрезентативності — це певні розбіжності між показниками вибіркового та суцільного спостереження.
За обсягом похибки репрезентативності ділять на надійну, звичайну та наближену. Інакше кажучи, допустимою є похибка в розмірі до 3 %, від 3 до 10 % та від 10 до 20 % відповідно, хоча у правовій статистиці бажано, щоб її розмір не перевищував 5-6 %. У противному разі є підстави говорити про недостатню репрезентативність вибірки.
Для обчислення похибки репрезентативності та того, як вона впливає на вибіркову чи генеральну сукупність, застосовуються позначення показників, наведені в табл. 5.
* В усіх таблицях для спрощеного розрахунку величини похибки кількість спостережень наводиться виходячи з цієї кількості.
Середня в генеральній сукупності відрізняється від середньої у вибірковій сукупності на величину похибки репрезентативності:
де А — похибка репрезентативності.
Наприклад, після проведення вибіркового спостереження з’ясувалось, що середній вік частки осіб, що були засуджені і нами досліджені, дорівнює 25 рокам (~ ). Розрахована похибка репрезентативності (А) становить ± 5 %, тобто — 1,25 року (32 х 5 %, або 32 х 0,05 = 1,25). Відповідно до наведеної формули середній вік засуджених у всій сукупності (25,0 ± 1,25) коливатиметься в межах від 23,75 до 26,25 року. Таким чином, ми вирішили головне завдання вибіркового спостереження — за здобутими нами вибірковими показниками (одержаними внаслідок проведеного дослідження) з’ясувати, чому дорівнюватимуть відповідні показники генеральної сукупності, які нам не відомі.
Згідно з теоремою П. Чебишева, з уточненнями О. Ляпунова в математиці було доведено, що при достатньо великій кількості обстежених одиниць сукупності середня величина досліджуваної ознаки у вибірковій сукупності відрізнятиметься від середньої величини в генеральній сукупності на величину
де А — гранична похибка вибірки, тобто похибка репрезентативності; f — середня похибка вибірки; t — коефіцієнт, що залежить від імовірності, з якою можна гарантувати певний розмір похибки репрезентативності. Якщо t = 0, то імовірність також дорівнює 0; якщо t = 0,5, то імовірність дорівнює 0,383, або 38,3 %; якщо t = 1, то імовірність дорівнює 0,683, або 68,3 %; якщо t = 2, то імовірність дорівнює 0,954, або 95,4 %; якщо t = 3, то імовірність дорівнює 0,997, або 99,7 %; якщо t = 4, то імовірність дорівнює 0,999936 і т. п. При цьому слід врахувати, що даний коефіцієнт може приймати не тільки цілі, але й дробові значення (інші умовні позначення містяться у табл. 5).
Із наведеної формули випливає, що похибка репрезентативності залежить від багатьох чинників: 1) імовірності, з якою ми бажаємо одержати результат; 2) чисельності одиниць вибіркової сукупності (чим менше одиниць складатиме вибіркова сукупність, тим більшою буде похибка репрезентативності, і навпаки); 3) однорідності досліджуваної сукупності (чим більш різнорідною є сукупність, тим більшою буде похибка репрезентативності), і 4) від способу відбору одиниць у вибіркову сукупність.
Як правило, при проведенні вибіркового спостереження перед дослідником для успішного його проведення необхідно поставити два взаємозв’язаних завдання: 1) визначення необхідної кількості одиниць вибіркової сукупності, тобто скільки одиниць обстежуватиметься (причому вибірка має бути репрезентативною); 2) розрахунок похибки репрезентативності зі встановленим рівнем імовірності.
Багаторічна практика свідчить, що довірча імовірність 95,4 (для t = 1) є оптимальною для більшості розрахунків у різних галузях господарства, тим більше для правових явищ. Тому для полегшення досить громіздких розрахунків похибки вибіркового спостереження існують спеціальні таблиці, застосовуючи які, можна визначити або величину похибки репрезентативності при певній кількості спостережень із довірчою імовірністю 95,4 %, або кількість вибіркових спостережень при заданій величині похибки репрезентативності з довірчою імовірністю
95,4 % без використання вищенаведеної формули[2]. Якщо таблиці відсутні, то в цьому випадку всі розрахунки необхідно проводити на базі раніш наведеної формули.
При визначенні обсягу вибірки необхідно виходити з умов наявності заданої величини похибки репрезентативності. Перетворивши попередню формулу, оптимальний розмір вибірки складе
де n — обсяг вибіркової сукупності; w — частина одиниць, які мають дану ознаку; t — коефіцієнт, квадрат якого гарантує вірогідність довірчого інтервалу. Квадрат цього коефіцієнта, що, як зазначалося, гарантує імовірність 95,4, дорівняє 4; А — похибка репрезентативності.
У конкретно-правових дослідженнях відсоток похибки середнього значення зазвичай задається самим дослідником на основі програми спостереження і відповідно до даних раніше проведених досліджень. Як правило, вважається допустимою гранична похибка вибірки (похибка репрезентативності) в межах 3-5 %.
Також варто пам’ятати, що головне при організації вибіркового спостереження — це доведення його обсягу до допустимого мінімуму. При цьому не слід прагнути до надмірного зменшення меж похибки вибірки, бо це може призвести до невиправданого збільшення обсягу вибірки і, отже, до підвищення витрат на проведення вибіркового спостереження. У той же час не можна і надмірно збільшувати розмір похибки репрезентативності, оскільки в цьому випадку хоча і відбудеться зменшення обсягу вибіркової сукупності, але це призведе до погіршення достовірності одержаних результатів.