Печать
PDF

Розділ ІХ Основні положення теорії імовірностей та вибіркового спостереження - § 2. Основні положення вибіркового спостереження та його значення для вивчення правових явищ

Posted in Учебные материалы - Правова статистика (В.В. Голіна)

Рейтинг пользователей: / 0
ХудшийЛучший 

§ 2. Основні положення вибіркового спостереження та його значення для вивчення правових явищ

При аналізі конкретного соціального явища необхідно отримати інформацію про нього. З наведеного прикладу про вік жертв зґвалту­вання видно, що ми досліджували не всіх жертв, а лише їх частину. Для того щоб відібрана сукупність відображала основні якості всього явища, вона має бути побудована за конкретними законами, де осно­вними категоріями є: вибірка (вибіркова сукупність), генеральна су­купність, репрезентативність, похибка репрезентативності, одиниця сукупності, способи побудови вибірки та ін.

Особливості вибіркового спостереження полягають у такому:

1)  при одержанні висновків використовується математика, її закони;

2)  дає можливість значно швидше і з меншими витратами часу та гро­шей отримати результат, вивчаючи не весь масив подій, а лише їх частину; 3) може бути застосоване для вивчення різних об’єктів: від конкретних питань (наприклад, вік, стать засуджених) до вивчення громадської думки чи рівня матеріального забезпечення населення.

Вибіркове спостереження — це таке статистичне спостереження, при якому дослідженню піддається не вся сукупність, що вивчається, а лише деяка, відібрана певним чином її частина, а отримані результа­ти вивчення цієї частини поширюються на всю сукупність.

Ця частина називається вибірковою сукупністю, або вибіркою. Грамотно створена вибірка має складати зменшений макет усієї (гене­ральної) сукупності. Усі одиниці сукупності називаються генеральною сукупністю. Указане поняття має два різновиди: визначена генеральна сукупність (коли її чисельність точно відома) і невизначена.

Для вивчення генеральної сукупності необхідно з’ясувати, за до­помогою якого методу її досліджувати: суцільного (вивчення всіх одиниць) чи вибіркового спостереження. Останнє застосовується в разі, коли: 1) генеральна сукупність об’єктивно не може бути повністю до­сліджена. Наприклад, для виявлення відсотка недоброякісної продук­ції, скажімо кондитерських виробів, можна відправити на харчову експертизу їх відповідну частину, а не всю партію; 2) суцільне дослі­дження є недоцільним. Зокрема, при вивченні добросовісності складан­ня процесуальних документів слідчими МВС навряд чи варто вивчати сотні тисяч матеріалів, які ними складаються; 3) обсяг генеральної сукупності є настільки великим, що вивчити всі одиниці є або фізично неможливим, або занадто трудомістким. Наприклад, йдеться про з’ясування соціально-демографічних ознак осіб, які вчинили злочини (вік, стать, освіта, рід занять тощо): в Україні за 2007 р. зареєстровано 401 293 злочини, з них особи встановлені у 273 991 випадку. Тут явно необхідно брати певну частину наведеної сукупності.

Однак виникає запитання: якою саме має бути ця частина? Осно­вною ознакою цієї частини генеральної сукупності, тобто вибірки, є її репрезентативність. Іншими словами, вибірка є репрезентативною, якщо її основні характеристики збігаються з основними характерис­тиками генеральної сукупності. Для досягнення вказаного необхідно виконати такі альтернативні дії: 1) взяти не менше 20 % генеральної сукупності, якщо ця кількість є можливою для обробки (не є занадто великою); 2) у разі недоцільності обробки 20 % генеральної сукупнос­ті можливим є вивчення одиниць сукупності в кількості не менше 100*;

3)  визначення обсягу вибіркової сукупності за формулою, яка розгля­датиметься наприкінці цього параграфа.

Головною характеристикою якості обраної вибірки є поняття похибки репрезентативності. Похибка репрезентативності — це певні розбіжнос­ті між показниками вибіркового та суцільного спостереження.

За обсягом похибки репрезентативності ділять на надійну, звичайну та наближену. Інакше кажучи, допустимою є похибка в розмірі до 3 %, від 3 до 10 % та від 10 до 20 % відповідно, хоча у правовій статистиці бажано, щоб її розмір не перевищував 5-6 %. У противному разі є під­стави говорити про недостатню репрезентативність вибірки.

Для обчислення похибки репрезентативності та того, як вона впли­ває на вибіркову чи генеральну сукупність, застосовуються позначен­ня показників, наведені в табл. 5.

 

 

* В усіх таблицях для спрощеного розрахунку величини похибки кількість спостережень наводиться виходячи з цієї кількості.

Середня в генеральній сукупності відрізняється від середньої у ви­бірковій сукупності на величину похибки репрезентативності:

де А — похибка репрезентативності.

Наприклад, після проведення вибіркового спостереження з’ясувалось, що середній вік частки осіб, що були засуджені і нами досліджені, до­рівнює 25 рокам (~ ). Розрахована похибка репрезентативності (А) становить ± 5 %, тобто — 1,25 року (32 х 5 %, або 32 х 0,05 = 1,25). Від­повідно до наведеної формули середній вік засуджених у всій сукупнос­ті (25,0 ± 1,25) коливатиметься в межах від 23,75 до 26,25 року. Таким чином, ми вирішили головне завдання вибіркового спостереження — за здобутими нами вибірковими показниками (одержаними внаслідок про­веденого дослідження) з’ясувати, чому дорівнюватимуть відповідні показники генеральної сукупності, які нам не відомі.

Згідно з теоремою П. Чебишева, з уточненнями О. Ляпунова в ма­тематиці було доведено, що при достатньо великій кількості обстежених одиниць сукупності середня величина досліджуваної ознаки у вибір­ковій сукупності відрізнятиметься від середньої величини в генеральній сукупності на величину

 

де А — гранична похибка вибірки, тобто похибка репрезентатив­ності; f — середня похибка вибірки; t — коефіцієнт, що залежить від імовірності, з якою можна гарантувати певний розмір похибки репре­зентативності. Якщо t = 0, то імовірність також дорівнює 0; якщо t = 0,5, то імовірність дорівнює 0,383, або 38,3 %; якщо t = 1, то імовірність дорівнює 0,683, або 68,3 %; якщо t = 2, то імовірність дорівнює 0,954, або 95,4 %; якщо t = 3, то імовірність дорівнює 0,997, або 99,7 %; якщо t = 4, то імовірність дорівнює 0,999936 і т. п. При цьому слід врахувати, що даний коефіцієнт може приймати не тільки цілі, але й дробові зна­чення (інші умовні позначення містяться у табл. 5).

Із наведеної формули випливає, що похибка репрезентативності за­лежить від багатьох чинників: 1) імовірності, з якою ми бажаємо одер­жати результат; 2) чисельності одиниць вибіркової сукупності (чим менше одиниць складатиме вибіркова сукупність, тим більшою буде похибка репрезентативності, і навпаки); 3) однорідності досліджуваної сукупності (чим більш різнорідною є сукупність, тим більшою буде похибка репрезентативності), і 4) від способу відбору одиниць у ви­біркову сукупність.

Як правило, при проведенні вибіркового спостереження перед до­слідником для успішного його проведення необхідно поставити два взаємозв’язаних завдання: 1) визначення необхідної кількості одиниць вибіркової сукупності, тобто скільки одиниць обстежуватиметься (при­чому вибірка має бути репрезентативною); 2) розрахунок похибки репрезентативності зі встановленим рівнем імовірності.

Багаторічна практика свідчить, що довірча імовірність 95,4 (для t = 1)  є оптимальною для більшості розрахунків у різних галузях господар­ства, тим більше для правових явищ. Тому для полегшення досить громіздких розрахунків похибки вибіркового спостереження існують спеціальні таблиці, застосовуючи які, можна визначити або величину похибки репрезентативності при певній кількості спостережень із до­вірчою імовірністю 95,4 %, або кількість вибіркових спостережень при заданій величині похибки репрезентативності з довірчою імовірністю

95,4  % без використання вищенаведеної формули[2]. Якщо таблиці від­сутні, то в цьому випадку всі розрахунки необхідно проводити на базі раніш наведеної формули.

При визначенні обсягу вибірки необхідно виходити з умов наяв­ності заданої величини похибки репрезентативності. Перетворивши попередню формулу, оптимальний розмір вибірки складе

де n — обсяг вибіркової сукупності; w — частина одиниць, які мають дану ознаку; t — коефіцієнт, квадрат якого гарантує вірогід­ність довірчого інтервалу. Квадрат цього коефіцієнта, що, як зазна­чалося, гарантує імовірність 95,4, дорівняє 4; А — похибка репрезен­тативності.

У конкретно-правових дослідженнях відсоток похибки середнього значення зазвичай задається самим дослідником на основі програми спостереження і відповідно до даних раніше проведених досліджень. Як правило, вважається допустимою гранична похибка вибірки (по­хибка репрезентативності) в межах 3-5 %.

Також варто пам’ятати, що головне при організації вибіркового спостереження — це доведення його обсягу до допустимого мінімуму. При цьому не слід прагнути до надмірного зменшення меж похибки вибірки, бо це може призвести до невиправданого збільшення обсягу вибірки і, отже, до підвищення витрат на проведення вибіркового спо­стереження. У той же час не можна і надмірно збільшувати розмір по­хибки репрезентативності, оскільки в цьому випадку хоча і відбудеться зменшення обсягу вибіркової сукупності, але це призведе до погіршен­ня достовірності одержаних результатів.