Взаємозалежності та неоднорідності в результатах президентських виборів

Для відображення взаємозалежностей показників і виокремлення “цікавих” ділянок на графіках я використав діаграми розсіювання. Дуже цікаво подивитись – скільки окремих трендів можна виділити в результатах голосування. Для аналізу взято результати голосування в третьому турі президентських виборів 2004 року, опубліковані на сайті Центральної виборчої комісії. Аналітичну обробку даних та побудову графіків здійснено за допомогою програмного середовища R.

Для відображення на діаграмах розсіювання із результатів по всіх виборчих дільницях було обрано наступні пари показників:

  1. “кiлькiсть голосiв за В. Ющенка” – “кiлькiсть голосiв за В. Януковича”;
  2. “вiдсоток явки виборцiв” – “вiдсоток голосiв за В. Ющенка”;
  3. “вiдсоток явки виборцiв” – “вiдсоток голосiв за В. Януковича”;
  4. “вiдсоток явки виборцiв” – “вiдсоток голосiв не пiдтримую жодного”.

Оскiльки масив даних характеризується високою щiльнiстю, побудова простої дiаграми розсiювання призводить до накладання точок одна на одну i маскування внутрiшньої структури даних на графiку. На звичайних дiаграмах розсiювання, побудованих по наявних даних, можна побачити лише граничнi областi, якi мають значно нижчу щiльнiсть точок. Приклад такої дiаграми наведено нижче:

Діаграма розсіювання кількості голосів за кандидатів по виборчих дільницях

Діаграма розсіювання кількості голосів за кандидатів по виборчих дільницях

Точки, якi значно видiляються вiд загальної сукупностi дуже великою кiлькiстю голосiв за одного iз кандидатiв належать виборчим дiльницям Закордонного виборчого округу.

Щоб вiдобразити внутрiшню структуру даних на дiаграмах розсiювання – нами застосований метод вiдображення не самих точок, а вiдносної щiльностi точок на площинi графiка. Для цього використано функцiю smoothScatter базового пакету graphics програмного середовища R. Результати побудови графiкiв щiльностi точок на дiаграмах розсiювання вiдображено на рисунках нижче. На всiх графiках вiдображено першi 500 точок в областi з найменшою щiльнiстю.

Щільність точок на діаграмі розсіювання кількості голосів за кандидатів на виборчих дільницях

Щільність точок на діаграмі розсіювання кількості голосів за кандидатів на виборчих дільницях

Щільність точок на діаграмі розсіювання відсотку явки виборців і відсотку голосів за В.Ющенка на виборчих дільницях

Щільність точок на діаграмі розсіювання відсотку явки виборців і відсотку голосів за В.Ющенка на виборчих дільницях

Щільність точок на діаграмі розсіювання відсотку явки виборців і відсотку голосів за В.Януковича на виборчих дільницях

Щільність точок на діаграмі розсіювання відсотку явки виборців і відсотку голосів за В.Януковича на виборчих дільницях

 

Щільність точок на діаграмі розсіювання відсотку явки виборців і відсотку голосів "не підтримую жодного" на виборчих дільницях

Щільність точок на діаграмі розсіювання відсотку явки виборців і відсотку голосів “не підтримую жодного” на виборчих дільницях

Графiк щiльностi точок на дiаграмi розсiювання кількості голосів за В.Ющенка та В.Януковича одразу вказує на неоднозначнiсть наявних даних. У третьому турi виборiв брали участь лише 3 «версiї голосування»: Ющенко, Янукович та «проти всiх». Графiк,  зображений на цьому рисунку, вказує на “нелогiчне” поводження деякої частини електорату: можна голосувати або за Ющенка, або за Януковича – це взаємовиключнi показники. Але центральна частина графiку (синя область, яка залягає пiд кутом до початку координат) вказує на те, що зi зростанням голосiв за Ющенка також зростала і кiлькiсть голосiв за Януковича. Тобто, ми можемо констатувати те, що певна частина нашої статистичної вибiрки являє собою окремий кластер, у якому простежується сильна позитивна кореляцiя мiж пiдтримкою обох кандидатiв. Для пояснення цього феномену слiд провести додатковi дослiдження. В принципi, ми не виключаємо i цiлком природне походження цього явища, наприклад – рiвновелику пiдтримку обох кандидатiв у деяких регiонах. Але при подiбному станi речей, щоб вийти на таку майже лiнiйну закономiрнiсть природним шляхом – треба було влаштувати справжнi змагання: чиїх виборцiв бiльше прийде.

Наступні графiки виглядають як дзеркальнi вiдображення один одного. В принципi – так i повинно бути за взаємовиключних умов голосування. А от графiк відсотку явки виборців та відсотку голосів “не підтримую жодного” також вказує на аномальну лiнiйнiсть поведiнки певної частини електорату. Звернiть увагу на лiнiйне сукупчення точок, якi вiдповiдають показнику явки виборцiв 100%. Тут також не можна виключати i природне походження подiбного викиду, але перше, що припадає на думку – навмиснi пiдтасовки бюлетенiв при високiй явцi виборцiв.

А якщо прийняти до уваги те, що реально iснує лише два взаємовиключних результати голосування виборцiв, можна прослiдити – на користь кого iз кандидатiв пiшли подiбнi махiнацiї (якщо вони справдi мали мiсце).

Якщо прийняти до уваги можливiсть голосування “проти всiх”, можливi лише три варiанти вiдповiдей, якi є взаємовиключними: “за Ющенка”, “за Януковича”, “на пiдтримую жодного”. Цю замкнену систему можна вiдобразити у виглядi тривимiрної проекцiї – трикутної дiаграми.

Розподіл даних голосування у тривимірному просторі взаємовиключних показників

Розподіл даних голосування у тривимірному просторі взаємовиключних показників

На трикутній діаграмі також помiтно лiнiйнiсть взаємовiдношення показникiв, яку складно пояснити з точки зору стохастичних процесiв (навiть у замкнений системi).

Leave a Comment

%d блогерам подобається це: