Кластеризація результатів голосування

Захотілось зробити із даних про парламентські вибори в Україні щось глибше і розумніше, ніж підрахунки в стилі “де/хто/скільки”. Для цього спробував застосувати кластерний аналіз до результатів голосування. В якості вихідних даних обрав значення: кількості голосів за кожну партію (29 партій), кількість виборців на дільниці та кількість врахованих голосів (“голоси ЗА”). Оскільки вихідна таблиця велика за розмірами (29674×31 значень) – довелось використати для кластеризації алгоритм CLARA (Clustering Large Applications), який власне і створений для кластерного аналізу великих масивів даних. В якості кінцевої кількості кластерів вибрав 5 (навмання, без жодної цілі). Для обчислення відстаней обрав відстань міських кварталів (“відстань Манхеттена”).

Результатом кластеризації, окрім матриці відстаней та інших параметрів, є відмітки приналежності кожної виборчої дільниці до конкретного кластеру. Кількість дільниць, які в межах областей належать до одного з п’яти кластерів, зображено на графіку.

 

Кількість виборчих дільниць, віднесених до одного з кластерів

Кількість виборчих дільниць, віднесених до одного з кластерів

Різниця між областями фіксується чітко. А тепер давайте розберемось із отриманими кластерами та характеристикою виборчих дільниць. Для цього ми подивимось характеристики самих кластерів, і потім – розберемось який із показників до якого кластера тяжіє. Щоб не писати забагато тексту, я створив зведені таблиці: показники кластерів та кількість медоїдів в координатах “кластер-показник”.

Номер кластеру Розмір (кількість дільниць) Максимальна відстань Середня відстань Відокремленість
1 7909 1122 243,7885 1,197
2 3737 2756 720,9976 2,179
3 3690 2077 766,2707 1,642
4 5381 2158 796,4678 1,663
5 8957 1963 472,4756 2,095

 

Показник Кластер 1 Кластер 2 Кластер 3 Кластер 4 Кластер 5
Кількість виборців на дільниці 158 2078 2223 1526 573
Кількість голосів «ЗА» 86 940 1280 587 342
Радикальна Партія 13 37 73 26 43
Солідарність жінок 0 15 13 9 1
Інтернет партія 0 13 5 2 1
Опозиційний блок 2 233 58 121 0
НАРОДНИЙ ФРОНТ 18 120 302 53 126
5.10 1 4 21 3 0
ЗАСТУП 6 3 3 8 18
ВІДРОДЖЕННЯ 0 1 5 1 1
НОВА ПОЛІТИКА 2 0 4 0 2
Єдина Країна 1 5 0 1 5
Сила Людей 0 1 0 0 2
ВО Свобода 1 21 74 29 15
Національна Демократична партія 0 1 0 0 0
Комуністична партія 0 50 67 29 3
Об єднання САМОПОМІЧ 2 90 174 58 16
УКРАЇНА — ЄДИНА КРАЇНА 0 0 0 0 1
ПРАВИЙ СЕКТОР 0 24 26 16 3
УКРАЇНА МАЙБУТНЬОГО 0 1 0 2 0
Ліберальна партія 0 0 0 0 0
Партія Зелених 1 4 5 2 1
Зелена планета 1 10 7 3 2
БЛОК ПЕТРА ПОРОШЕНКА 26 190 268 137 67
Сила і Честь 0 0 2 0 0
Конгрес Українських Націоналістів 0 0 0 0 0
Сильна Україна 2 55 34 29 1
ВО Батьківщина 8 32 85 24 27
Громадянська позиція 1 27 54 33 7
БЛОК ЛІВИХ СИЛ 1 2 0 0 0
Громадянський рух 0 1 0 1 0

 

Кількість медоїдів, віднесених до одного з кластерів

Кількість медоїдів, віднесених до одного з кластерів

 Отже, із зовнішнім виглядом нашої кластеризації ми розібрались. А тепер – давайте розберемось із результатами та їхнім практичним застосуванням. Суть дослідження полягала у тому, щоб знайти та класифікувати декілька “типів” виборчих дільниць. Віднайти типи нам вдалось. А тепер треба класифікувати ці дільниці. Тобто – описати кластери, які ми отримали.

Для описання кластерів ми використаємо таблицю, яка виробляється при кластеризації. У цю таблицю автоматично заносяться “найкращі приклади” об’єктів в кожному кластері. Це об’єкти, які є взірцем і еталоном в межах нашої кластеризації. Загалом до цієї таблиці потрапило 50 таких “еталонів”. І дивлячись на ці еталони та порівнюючи їх із попередніми таблицями – ми можем скласти загальний портрет наших кластерів.

Одномандатний виборчий округ Номер дільниці Тип дільниці Область Район/місто Кількість виборців на дільниці Номер кластеру
96 320356 звичайна Київська Вишгородський 158 1
189 680624 звичайна Хмельницька Красилівський 137 1
64 180396 звичайна Житомирська Коростенський 139 1
159 590448 звичайна Сумська Путивльський 180 1
119 460068 звичайна Львівська Бродівський 107 1
119 460038 звичайна Львівська Бродівський 177 1
27 121230 медична Дніпропетровська м.Дніпропетровськ 119 1
23 070669 звичайна Волинська Маневицький 249 1
14 050065 звичайна Вінницька Барський 206 1
15 050722 звичайна Вінницька Мурованокуриловецький 76 1
14 051064 звичайна Вінницька Тиврівський 253 1
23 070301 звичайна Волинська Ківерцівський 234 1
16 050683 звичайна Вінницька Могилів-Подільський 277 1
96 320490 звичайна Київська Іванківський 275 1
159 590213 звичайна Сумська Конотопський 331 1
25 121084 звичайна Дніпропетровська м.Дніпропетровськ 2078 2
181 630808 звичайна Харківська Харківський 2045 2
179 631013 звичайна Харківська м.Лозова 1959 2
75 230956 звичайна Запорізька м.Запоріжжя 2080 2
169 631263 звичайна Харківська м.Харків 2212 2
142 510436 звичайна Одеська Кілійський 2037 2
24 121244 звичайна Дніпропетровська м.Дніпропетровськ 2281 2
12 051474 звичайна Вінницька м.Вінниця 1768 2
131 480725 звичайна Миколаївська м.Южноукраїнськ 1722 2
157 590937 звичайна Сумська м.Суми 2284 3
219 800768 звичайна м.Київ Святошинський 2276 3
144 531216 звичайна Полтавська м.Полтава 2497 3
144 531206 звичайна Полтавська м.Полтава 2223 3
116 461923 звичайна Львівська м.Львів 1836 3
99 350923 звичайна Кіровоградська м.Кіровоград 2343 3
25 121324 звичайна Дніпропетровська м.Дніпропетровськ 1526 4
131 480647 звичайна Миколаївська м.Вознесенськ 1586 4
29 120381 звичайна Дніпропетровська Петриківський 1521 4
223 800965 звичайна м.Київ Шевченківський 1406 4
166 610837 звичайна Тернопільська Теребовлянський 1388 4
19 070972 звичайна Волинська м.Володимир-Волинський 1614 4
153 560675 звичайна Рівненська Рівненський 772 5
18 050837 звичайна Вінницька Немирівський 650 5
190 681229 звичайна Хмельницька Шепетівський 573 5
35 120761 звичайна Дніпропетровська м.Нікополь 957 5
164 611082 звичайна Тернопільська Шумський 531 5
139 510269 звичайна Одеська Біляївський 819 5
18 050853 звичайна Вінницька Оратівський 507 5
15 051127 звичайна Вінницька Томашпільський 1024 5
102 350369 звичайна Кіровоградська Новгородківський 531 5
120 460761 звичайна Львівська Мостиський 465 5
196 710844 звичайна Черкаська Шполянський 1045 5
179 630545 звичайна Харківська Красноградський 596 5
67 181183 звичайна Житомирська Чуднівський 424 5
122 461642 звичайна Львівська Яворівський 388 5

Кластер №1 – дрібні виборчі дільниці, які розташовані переважно у сільській місцевості. Ми не будемо брати до уваги дільницю №121230, яка розташована у медичному закладі в м.Дніпропетровськ. На цих дільницях “достукатись” до виборців змогли лише Радикальна Партія Олега Ляшка, НАРОДНИЙ ФРОНТ, БЛОК ПЕТРА ПОРОШЕНКА. Це видно з таблиці, де відображено кількість медоїдів, що потрапили до кожного кластеру. Трохи нижчий результат показала ВО Батьківщина. Всі інші політичні сили на цих дільницях було проігноровано виборцями. Дільницям цього кластеру притаманна доволі висока явка виборців. Середньозважене значення явки для цих дільниць становить 57,96%.

Кластер №2 – великі дільниці, розташовані в південно-східних регіонах України. Основна електоральна база Опозиційного блоку (“голос промислових регіонів”). Але цю базу добряче пошматували НАРОДНИЙ ФРОНТ та БЛОК ПЕТРА ПОРОШЕНКА. Цей кластер має найнижчу явку, середньозважене значення якої становить лише 43,47%.

Кластер №3 – великі дільниці, розташовані в північно-західних регіонах України (включаючи м.Київ). Це основне поле підтримки “проєвропейських” партій: НАРОДНОГО ФРОНТУ, САМОПОМІЧІ, БЛОКУ ПЕТРА ПОРОШЕНКА. Але, як це не дивно, саме тут зосереджена і основна підтримка таких ідеологічно полярних політичних сил, як ВО Свобода та Комуністична партія. Для цих дільниць характерна висока явка – аж 57,13%.

Кластер №4 – також великі дільниці, але з “невизначеним розташуванням”. Справа в тому, що до цього кластеру потрапила велика кількість дільниць з усіх областей Україні. З південно-східних регіонів дільниць більше, але є велика кількість і з північно-західних. Дільниці цього кластеру стали полем бою між БЛОКОМ ПЕТРА ПОРОШЕНКА та Опозиційним блоком. Як і дільниці кластеру №2 – дільниці 4-го кластеру характеризуються доволі низькою явкою – лише 45,21%. Але на відміну від 2-го кластеру – ці дільниці “розпорошені” по великих містах всіх регіонів України. На мою думку – саме цей кластер є усередненим портретом міського населення нашої країни. До речі, на діаграмі розсіювання, що зображена нижче, фіксуються два ядра у щільності точок. Це означає, що цей кластер не є монолітним – його можна поділити на два підкластери. Ці підкластери виділяються саме за середнім відсотком явки виборців: для першого підкластеру середня явка виборців групується в межах 38-40%, для другого підкластеру – в межах 55-57%. Можливо, саме показник явки відображує географічне розташування виборчих дільниць. Із характеристик всіх інших кластерів ми знаємо, що північний захід показує більшу явку, ніж південний схід.

Кластер №5 – великі села та районні міста із поміркованими проукраїнськими поглядами. Іншої характеристики цим дільницям я дати не можу. Подивіться на результати кластеризації: голосування однозначно тяжіє до НАРОДНОГО ФРОНТУ; БЛОК ПЕТРА ПОРОШЕНКА залишився далеко позаду. А ще – на цих дільницях доволі низька підтримка Радикальної Партії Олега Ляшка, і майже ніяка – ВО Свободи та ВО Батьківщини. Я вважаю, що цей кластер є узагальненим портретом для населення сільської місцевості та невеликих міст – тобто населених пунктів із найбільш прагматичним світоглядом мешканців. Тут не повірили Ляшку, Комуністам та ПРАВОМУ СЕКТОРУ, тут висока організованість населення (середня явка виборців становить 54,31%). В цьому кластеру зосереджено 8957 дільниць, на яких “мешкає” 5846449 виборців, що становить 18,70 відсотків від загальноукраїнської кількості виборців.

Для наочності я побудував діаграму розсіювання (точніше – ядерного оцінювання щільності), на якій відображено кількість дільниць із конкретним показником відносної явки для кожного із п’яти виділених кластерів.

Діаграма розсіювання відносної явки виборців на виборчих дільницях з різних кластерів

Діаграма розсіювання відносної явки виборців на виборчих дільницях з різних кластерів

Які можна зробити висновки з усієї цієї писанини? Знову підтверджуються загальновідомі тенденції в голосуванні – явка виборців на північному заході більша, ніж на південному сході; регіонали та комуністи “виїжджають” за рахунок зниженої явки (а це ключовий момент мажоритарної системи!). Низька підтримка ВО Свободи характерна і для “бЄндЄровских сёл” – і це ще один цвях у труну російської пропаганди. Ну і, нарешті, – не будь мажоритарки – тоді б НАРОДНИЙ ФРОНТ отримав би колосальний кредит довіри в північно-східних регіонах, селах та невеликих містах, а БЛОК ПЕТРА ПОРОШЕНКА – ділив би перемогу із Опозиційним блоком на південному сході та крупних містах України.

1 Comment

  1. Pingback: Вибори та кластеризація територіальних громад – DataStory

Leave a Comment

%d блогерам подобається це: