Розділ VI Графічне зображення статистичних даних
Розділ VI Графічне зображення статистичних даних
§ 1. Поняття про статистичні графіки. Основні елементи статистичних графіків
Статистичні дані можна зобразити різними способами. Найбільш наочне зображення дає застосування графіків. Графіком у статистиці називають наочне зображення статистичних величин за допомогою геометричних фігур.
Графічний засіб зображення статистичних даних доповнює статистичні таблиці, а іноді й замінює їх. Завдяки графікам статистичний матеріал стає більш зрозумілим, краще усвідомлюється і запам’ятовується. Графіки мають велике значення у справі оперативного управління, тому при наведенні даних про стан злочинності органами внутрішніх справ обов’язково використовуються графіки.
Графічний метод у статистиці нараховує більше 200 років. Вважається, що перші дані про техніку складання статистичних графіків наведено у роботі англійського економіста У. Плейфейра «Комерційний та політичний атлас», яка вперше була надрукована у 1786 р.
Побудувати простий графік було справою дуже складною, посильною лише для професіоналів. Тому дуже рідко на території колишнього Радянського Союзу з’являлися монографічні видання про використання графічного зображення в статистиці. Зараз побудувати графік за допомогою сучасної комп’ютерної техніки не складно, оскільки мова графіка належить до мовних систем, тобто розвиток графічного методу пов’язаний із розвитком семіотики — науки про знаки та знакові системи, котра склалась як наука у 30-х рр. ХХ ст. На відповідному етапі розвиток теорії графіків та науки семіотики був пов’язаний і з розвитком математичної логіки.
До статистичних графіків ставляться такі основні вимоги:
1) повинні абсолютно точно відображати вихідні дані;
2) бути наочними і зрозумілими;
3) бути художньо оформленими.
Статистичний графік — це рисунок (креслення), який описує статистичні сукупності (їх обсяг, структуру, зміну в часі, розподіл у просторі) умовною мовою геометричних знаків. Він повинен містити такі основні елементи: 1) поле графіка, 2) графічний образ, 3) орієнтири простору; 4) масштабні орієнтири; 5) легенду (експлікацію) графіка.
Поле графіка характеризує його формат, тобто розмір і пропорції сторін. Розмір графіка залежить від його призначення. Вважається, що найбільш оптимальним для глядача є графік із співвідношенням сторін від 1:1,3 до 1:1,5. У багатьох випадках зручною є квадратна форма графіка. Інакше кажучи, поле графіка — це частина площини, тобто простір розміщення знаків. Залежно від мети і завдань графіка воно може бути або чистим, або заштрихованим. Заштриховане найчастіше застосовується при підготовці графіка за допомогою електронно- обчислювальної техніки, що дозволяє більш рельєфно відокремити ті чи інші графічні образи.
Графічний образ — це сукупність знаків, за допомогою яких зображуються статистичні дані. Це основа графіка. Знаки можуть бути різними: лінії, точки, площинні геометричні фігури (прямокутники, квадрати, круги), об’ємні геометричні фігури, а також іноді й негео- метричні фігури у вигляді силуетів або рисунків предметів. Статистичні дані можна зобразити за допомогою різних графічних образів, тому вони мають відповідати меті графіка і бути найбільш виразними для зображення даних.
Залежно від того, які використовуються геометричні знаки, усі графіки поділяють на точкові, лінійні, стовпчикові, стрічкові, кругові тощо. Графічні комп’ютерні програми мають великий набір цих знаків (одинарних і подвійних, суцільних та перервних ліній різної товщини та кольору, інших позначень та символів), що дає змогу зображати графічні фігури таким чином, щоб вони істотно відрізнялися одна від одної.
Орієнтири простору визначають розміщення графічного образу на полі графіка. Вони можуть мати вигляд системи координат, географічних орієнтирів (контури річок, лінії берегів, морів та океанів) або адміністративних кордонів. У статистичних графіках системи координат можуть застосовуватися як у двомірному, так і в тримірному зображенні.
Масштабні орієнтири за допомогою системи масштабних шкал надають графічному образу кількісне значення. Масштабною шкалою називають лінію, окремі точки якої можуть бути прочитані як певні числа відповідно до прийнятого масштабу. Масштаб графіка — це умовна міра переведення числової величини в графічну. Масштабні шкали можуть бути прямолінійними і криволінійними (круговими), рівномірними і нерівномірними. У статистичних графіках найчастіше застосовуються прямолінійні шкали, а криволінійні — у секторних діаграмах. Шкала є рівномірною, коли рівним числовим інтервалам відповідають рівні графічні інтервали, якщо числа збільшуються вдвічі, то й відрізки збільшуються вдвічі. Масштаб рівномірної шкали — це лінійна міра, кількість міліметрів у відрізку, який прийнято за одиницю числового значення статистичного показника. Чим довший відрізок, який прийнято за числову одиницю, тим крупніший масштаб. Масштаб обчислюють шляхом ділення довжини масштабної шкали на максимальний розмір відображуваного показника.
Якщо рівним інтервалам відповідають нерівні графічні інтервали, то масштабна шкала буде нерівномірною. У статистичних графіках як нерівномірні шкали застосовуються логарифмічні шкали, у яких відрізки пропорційні не числам, а їх логарифмам. Як правило, у правовій статистиці застосовуються рівномірні шкали, в яких відрізки пропорційні числам і які найчастіше розташовуються по осях координат.
Легенда (експлікація) графіка — це словесне пояснення розміщених на графіку геометричних фігур та способів зображення, розкриття його змісту. Легенда графіка включає: назву графіка (загальний заголовок); словесні пояснення умовних позначень окремих елементів графічного образу; назву одиниць виміру параметрів; надписи вздовж масштабних шкал тощо. Загальний заголовок графіка повинен у стислій формі розкривати основний зміст зображених даних. Легенда графіка — це другий основний елемент графіка після графічного образу, тому що без нього графік не можна прочитати і зрозуміти.
Сучасна електронна техніка дозволяє розташувати легенду графіка в будь-якому місці. З точки зору статистики краще її розташовувати під графіком.
§ 2. Види графіків і правила їх побудови
Графіки, які використовуються в статистиці, можна класифікувати по-різному. Графіки в статистиці використовуються головним чином з метою:
1) порівняння однойменних показників різних об’єктів або територій;
2) характеристики структури явищ та їх структурних зрушень;
3) характеристики варіаційних рядів розподілу;
4) вивчення зміни величини явища в часі;
5) вивчення взаємозалежності між явищами;
6) наочного зображення розподілу явищ за територією.
Оскільки ці завдання можуть вирішуватися різними видами графіків, то нижче наводяться окремі види графіків за способом їх побудови і роз’яснюється, для вирішення яких завдань вони можуть використовуватися.
За способом побудови графіки поділяються на діаграми, картодіаграми та картограми.
Діаграма — це такий рисунок, на якому статистичні дані зображують за допомогою геометричних фігур (ліній, стовпчиків, точок тощо). Інакше кажучи, якщо територія, до якої належать зображені на графіку показники, вказана тільки словесно (у загальному заголовку або пояснювальних написах), то графік називається діаграмою.
На картодіаграмі статистичні дані зображують за допомогою різних фігур на географічній карті або плані місцевості.
На картограмі величину статистичних показників зображують шляхом штрихування або розфарбовування відповідної території на географічній карті або плані місцевості.
Найбільш поширеним видом статистичних графіків є діаграми, які залежно від графічного образу мають різні назви (наприклад, стовпчикові, лінійні і т. п.). Розглянемо діаграми, які найчастіше використовуються в правовій статистиці для зображення статистичних даних.
Стовпчикові (стрічкові) діаграми застосовуються для порівняння показників, характеристики динаміки явища та його структури.
Щоб побудувати стовпчикову діаграму для характеристики порівняння і динаміки явищ, необхідно накреслити прямокутну систему координат. Кожне значення порівнюваного показника зображується у вигляді вертикального прямокутного стовпчика. Основи всіх стовпчиків розташовані на горизонтальній осі координатної системи, тобто на осі абсцис. Ширина кожного стовпчика береться довільна, але обов’язково однакова. Довжина кожного стовпчика залежить від величини показника, який нанесено у відповідному масштабі по осі ординат. Проміжки між стовпчиками також слід робити однакові. Стовпчики повинні бути заштриховані або зафарбовані, але обов’язково однаково. Загальна кількість стовпчиків має відповідати загальній кількості об’єктів або проміжків (моментів) часу. Однак якщо показників значна кількість, то треба будувати не більше 8-10 стовпчиків, щоб графік не втратив наочності.
Крім того, виділяють частину поля графіка (зверху або знизу) для нанесення загального заголовка графіка. Ми будемо наносити загальний заголовок знизу, тому що це теоретично найбільш правильно.
Наведемо дані про кількість зареєстрованих за роки незалежності в Україні злочинів (табл. 2).
За даними табл. 2 побудуємо стовпчикову діаграму, яка буде характеризувати кількість в окремі роки. Побудуємо 9 стовпчиків, які характеризують рівень злочинності в Україні в 1991, 1993, 1995, 1997, 1999, 2001, 2003, 2005 і 2007 рр. Приймемо масштаб по осі ординат — 100 тисяч злочинів в 1 см (рис. 3). Після вибору масштабу на масштабній шкалі наносимо масштабні штрихи і проставляємо їх цифрові позначення.
Рис. 3 дає наочне уявлення про зміну рівня злочинності в Україні за роки незалежності. Така побудова графіка зумовлена тим, що відповідно до вимог його побудови стовпчиків не повинно бути понад 10, а також тим, що для більшої наочності ми взяли більш тривалий час, побудувавши дані лише за непарні роки.
Якщо стовпчики розташовані не по вертикалі, а по горизонталі, діаграма називається стрічковою. Порядок побудови стрічкових діаграм такий же, як і стовпчикових, тільки масштаб розміщується по осі абсцис, а не по осі ординат. Стовпчики розміщують щільно один до одного, хоча існує думка, згідно з якою вони не повинні щільно прилягати один до одного. (Вважаємо, що ця точка зору не відповідає ні теорії, ні практиці побудови графіків.)
Щоб отримати інформацію про територіальну різницю, яка склалась на території країни, у правовій статистиці показники кожної області дуже часто порівнюють із середнім показником по країні. Найбільш наочною в цьому разі буде стрічкова діаграма, в якій показники будуть наведені по ранжиру (у порядку зменшення величини досліджуваного показника). Стовпчики розміщуються щільно один до одного, середній показник по країні зафарбовується, щоб було наочніше видно, у яких областях цей показник більше, ніж в середньому по країні. Побудуємо стрічкову діаграму коефіцієнта злочинності, який дає змогу враховувати рівень кри- міногенності в країні (порядок його обчислення див. в розділі VIII), відповідно до даних, які наведені в табл. 3 (перелік областей у цій таблиці наведено за абеткою). Прийнявши відповідний масштаб на осі абсцис, побудуємо графік (рис. 4).
Стовпчикові діаграми можуть бути застосовані і для характеристики структури явища. Відносні величини структури характеризують відношення частини явища до цілого. Підсумувавши всі частини, ми одержуємо або 100 %, або 1 (якщо частки виражаються у коефіцієнтах). Для побудови стовпчикових діаграм структури статистичні дані краще наводити у відсотках. Висота стовпчика приймається за 100 %, а його частки визначаються відповідно до обчислених відсотків і виділяються різною штриховкою або різними кольорами.
При побудові такого графіка треба обов’язково (зазвичай, під графіком) навести умовні позначення окремих частин структури явища. Спочатку слід вирішити, яка частина явища матиме найтемніше забарвлення (та, яка зустрічається найчастіше, або навпаки). Як правило, та частина явища, яка зустрічається найчастіше, фарбується темнішим кольором або густішою штриховкою.
Якщо на графіку побудувати декілька структурних стовпчиків, то такий графік буде одночасно давати наочне уявлення не тільки про структуру явища, але й про структурні зрушення, які мали місце в цьому явищі за досліджуваний проміжок часу.
Секторні діаграми. У правовій статистиці секторні діаграми широко застосовуються для зображення структури явища (структури злочинності за різними показниками, а також структури цивільно- правових та адміністративних явищ), тому що вони найбільш виразно характеризують частини цілого.
Секторна діаграма — це круг, який поділено на сектори, розмір котрих відповідає величині даної частини цілого. Побудувати її неважко. Площу круга приймають за 100 %, тоді 3,6° буде відповідати одному відсотку. Множенням кожної частини цілого у відсотках на 3,6° обчислимо величину центральних секторів у градусах, які і відкладемо на діаграмі. Кожну частину цілого при цьому необхідно заштрихувати або зафарбувати по-різному і під графіком навести умовні позначення. Маємо такі дані про стан злочинності в області: крадіжки державного і колективного майна — 25,8 %, крадіжки особистого майна — 34,4 %, грабежі і розбої — 7,1 %, хуліганство — 9,2 %, шахрайство — 4,3 %, тяжкі злочини проти особи — 3,1 %, злочини, які пов’язані з наркотиками — 4,9 %, ДТП із смертельними наслідками — 1,0 %, інші злочини — 10,2 %. (рис. 5).
Лінійні діаграми. Лінійні діаграми можуть використовуватися для зображення рядів динаміки, зображення зміни структури явища, характеристики виконання плану, а також для вивчення кореляційних зв’язків між явищами.
Для побудови лінійної діаграми використовується система прямокутних координат. На горизонтальній осі в прийнятому масшта
бі відкладається час (або факторні ознаки, якщо вивчається кореляційна залежність), а по вертикальній осі — рівні ряду динаміки (або розміри результативної ознаки). За відмітками на обох осях визначають місцезнаходження точок на полі діаграми (точки перетину ліній). Послідовно з’єднуючи їх прямими лініями, одержуємо ламану лінію. Для полегшення побудови лінійної діаграми доцільно побудувати числову сітку шляхом нанесення тонких прямих ліній через поділки горизонтальних і вертикальних шкал. При цьому слід точно додержуватися масштабу як для рівнів ряду динаміки, так і для часу. За даними табл. 2 побудуємо лінійну діаграму злочинності в Україні (рис. 6).
Якщо на числовій сітці будується ламана лінія, яка займає лише верхню частину сітки (рис. 6), то нижня її частина може бути виключена шляхом розриву шкали і сітки або шляхом переносу осі абсцис на відповідний відрізок (на рис. 6 — це 200 тис. злочинів). Межі розриву обов’язково показують хвилястою лінією. Розрив можна робити і на вертикальній осі.
Лінійні координатні діаграми, які відображають динаміку суспільного явища, можуть відрізнятися і за побудовою координатної сітки. Як правило, у правовій статистиці використовується прямокутна координатна сітка (рис. 6).
Лінійні діаграми мають позитивну властивість — на одному графіку можна побудувати декілька ламаних ліній, які будуть характеризувати різні показники. (наприклад, на рис. 6 можна нанести дані про кількість зареєстрованих злочинів в інших країнах або областях України).
Лінійні діаграми, які відображають основні закономірності явища, можна також застосувати для його прогнозування, використовуючи метод екстраполяції, продовжити його за межі відомого часу, у майбутнє.
Графіки варіаційних рядів розподілу — це гістограма, полігон та кумулята.
Варіаційні ряди розподілу зображаються графічно у вигляді лінійних або площинних діаграм у системі прямокутних координат. По осі абсцис відкладаються значення варіантів, а по осі ординат — абсолютні або відносні значення частот.
Гістограма застосовується переважно для зображення інтерваль- них варіаційних рядів розподілу. Вона будується так: на осі абсцис відкладають інтервали ознаки, а на осі ординат — їх чисельність (частоти). На відрізках, які характеризують межі інтервалів, будують прямокутники, висота яких дорівнює частоті даного інтервалу. Площа кожного стовпчика повинна бути пропорційною частоті. При рівних інтервалах ширину стовпчика приймають однаковою. Інакше кажучи, площа всієї гістограми чисельно дорівнює сумі частот або чисельності одиниць у сукупності.
Гістограма може бути використана для графічного знаходження моди (теорія цього показника буде розглянута в розд. ІХ). Для цього необхідно з’єднати прямими лініями верхні кути модального стовпчика з верхніми кутами сусідніх стовпчиків, які примикають до нього. Абсциса точки перетину цих прямих відповідає моді.
Полігон (многокутник) застосовується переважно для зображення дискретних рядів розподілу. Цей графік має вигляд не стовпчиків, а многокутника. Будується він також у прямокутній системі координат. По осі абсцис відкладаються значення дискретної ознаки, а по осі ординат — частоти. Точки послідовно з’єднуються і набувають вигляду ламаної лінії. Для кращого розуміння графіка його рекомендується замикати, з’єднувати крайні точки полігону з віссю абсцис.
Гістограму дуже легко перетворити в полігон. Для цього необхідно послідовно з’єднати всі середні точки верхніх ліній кожного стовпчика і одержану ламану лінію з’єднати з віссю абсцис. Полігон розподілу також можна перетворити в гістограму, для цього потрібно відповідно розмістити стовпчики.
За допомогою полігону можна визначити моду. Для цього треба з вершини полігона опустити перпендикуляр на вісь абсцис. Точка перетину перпендикуляра з віссю абсцис і є значенням моди.
Кумулята. Кожний варіаційний ряд можна графічно зобразити у вигляді кумуляти. Для цього на осі абсцис слід відкласти значення варіантів або межі інтервалів, а по осі ординат — відповідні частоти наростаючим підсумком. Одержані точки необхідно з’єднати плавною лінією, тобто плавною кривою, яка має назву кумуляти, або кумулятивної кривої.
Кумулята дає змогу графічно визначити медіану (теорія обчислення і застосування цього показника буде викладено в розд. ІХ). Для цього потрібно через середину найбільшої ординати, яка відповідає загальній кількості одиниць сукупності, провести пряму лінію паралельно осі абсцис. Абсциса точки перетину цієї прямої лінії з кумуля- тою дає значення медіани.
Картограми і картодіаграми. Для порівняння однойменних явищ у просторі використовують також картограми і картодіаграми. При їх побудові геометричні образи й умовні позначення розташовуються на географічній карті або плані місцевості.
Картограмою називається географічна карта (звичайно контурна), на якій інтенсивність поширення зображуваного явища (наприклад, коефіцієнта злочинності) показують різною штриховкою або кольорами. Більш темні і яскраві фарби означають, що явище трапляється частіше, а світлі — менше. Таким чином можна наочно зобразити «географію злочинності» в державі, а також поширення цивільних спорів на 10 тис. населення тощо. Іноді на карту наносять абсолютні дані у вигляді точок, кожна з яких означає одну й ту ж величину.
На рис. 7 наведено картограму злочинності (коефіцієнта злочинності) по областях України (у середньому за офіційними даними; див. табл. 3). Це приклад фонової картограми, тому що на ній зображено
якісний показник — відносну величину. На території України знаходяться 24 області і Автономна Республіка Крим. Теорія побудови фонових картограм потребує, щоб кількість груп, для яких встановлюється різний тип штриховки або фарбування, не перевищувала 6-8, оскільки при більшій кількості діаграма може втратити наочність. (Ми розділили всі території на 6 груп за величиною показника — коефіцієнта злочинності).
Картодіаграмою називається географічна карта, на якій абсолютні дані зображуються по окремих територіях за допомогою геометричних образів (прямокутників, кругів та ін.) у масштабі з метою наочності виявлення розміру явища. Інакше кажучи, картодіаграма поєднує в собі картограму, яка демонструє розміщення явища в просторі, з діаграмою, яка показує розмір явища. У правовій статистиці вони використовуються дуже рідко, тому ми їх не наводимо.
Питання та завдання для самоконтролю
1. Дайте пояснення сутності графічного зображення. З якою метою будуються графіки при дослідженнях правових явищ?
2. Перерахуйте і охарактеризуйте основні елементи графіків.
3. Охарактеризуйте основні види графіків.
4. Охарактеризуйте основні правила побудови стрічкових діаграм. Поясніть їх значення для аналітичної роботи з метою порівняння криміногенності окремих територій країни.
5. Назвіть загальні правила побудови секторних діаграм.
6. Поясніть різницю між картограмою і картодіаграмою.
Завдання 1. Після узагальнення даних про вік осіб, які вчинили злочини, маємо таке: до 18 років — 2 особи; 18-24 роки — 9; 25-28 років — 14; 29-39 років — 26; 40-49 років — 22; 50-59 років — 16; 60 років і більше — 11 осіб. Побудуйте розподіл усіх осіб, що вчинили злочини, у вигляді секторної діаграми. Зробіть висновки.
Завдання 2. Маємо такі дані про кількість злочинів на 10 тис. населення: у середньому по області 80; у районі А — 68; у районі Б — 85; у районі В — 87; у районі Г — 65 злочинів. За цими даними побудуйте стрічкову діаграму. Зробіть висновки.
Завдання 3. За даними про віковий склад осіб, що вчинили злочини (завдання 1), побудуйте стовпчикову діаграму. Зробіть висновки.