Мовні особливості територіальних громад

Оскільки глибоке дослідження електоральних настроїв населення та електоральних типів територіальних громад неможливе без врахування етнокультурних особливостей регіонів, мені довелось трохи відволіктись на вивчення власне етнічної складової населення України. Нажаль, найновішими даними всеукраїнського масштабу по цій проблематиці є результати загальноукраїнського перепису населення 2001 року. Саме ці дані я і взяв в якості першоджерела.

У дослідженні електоральних кластерів я оперував даними на рівні районів та міст обласного значення. Етнокультурні особливості також будемо вивчати на цьому рівні абстракції. Первинні абсолютні показники (кількість осіб) з результатів перепису населення я не знайшов, через це будемо оперувати відносними показниками – відсотковим складом населення. Нагадаю читачам, що серед запитань в анкеті перепису населення фігурувало питання “Назвіть мову, яку Ви вважаєте рідною”. У варіантах відповідей фігурувало 17 основних мов та одна додаткова (для Закарпатської та Львівської областей). До основних мов віднесено: українську, російську, білоруську, болгарську, вірменську, гагаузьку, кримсько-татарську, молдовську, німецьку, польську, циганську, румунську, словацьку, угорську, караїмську, єврейську, грецьку. Окремо для Закарпатської та Львівської області було позначено русинську мову.

За результатами опитування складено таблиці, в яких зазначено відсотковий склад “рідних мов” в структурі населення. Дані подано для різних рівнів територіально-адміністративного поділу. Нас цікавить інформація на рівні районів та міст обласного значення. Цих даних в первинній таблиці – 683 записи. Однією з особливостей таблиці є подання запорогових величин – низькі показники відсотків показані нульовими значеннями. При виконанні дослідження я використовував програмне середовище R, картограму побудовано в геоінформаційній системі QGIS, картографічну основу взято з міжнародного проекту OpenStreetMap.

Для виявлення загальних особливостей поширення в Україні мов я використав кореляційний аналіз. Дві мови: словацьку та русинську довелось відкинути із розрахунків через занадто малу кількість даних. На діаграмі нижче представлені кореляційні зв’язки між різними мовами на рівні районів та міст обласного значення. Для обчислення взаємозв’язків використано коефіцієнт кореляції r-Пірсона. При обчисленні значимості кореляційних зв’язків застосовано поправку Беньяміні-Йекутілі. Незначимі кореляції (на рівні значущості α=0,05) закреслено. Нижче основної діагоналі матриці представлені “сирі” величини значимості, вище основної діагоналі – при введенні поправки Беньяміні-Йекутілі. Відповідно, кількість закреслених значень буде різною вище та нижче головної діагоналі. При відбудові діаграми застосовано ієрархічну кластеризацію для групування мов за наявністю сумісного поширення в регіонах України.

Кореляція "рідних мов" за даними перепису населення 2001р.

Кореляція “рідних мов” за даними перепису населення 2001р.

На діаграмі добре простежуються декілька “мовних кластерів”, які обумовлені сумісним поширенням мов серед населення регіонів України. Цікавим також виглядає факт сильної негативної кореляції російської мови із українською, польською та угорською при тому, що три останні мови навпаки показують сильну спорідненість. Такий взаємозв’язок із російською мовою вказує на витіснення регіональних мов в наслідок політики примусової русифікації.

Щоб більш детально дослідити особливості регіонів я використав кластерний аналіз. При кластеризації дані було нормалізовано. В якості метрики використана відстань міських кварталів, для кластеризації застосовано метод Варда. Кількість кінцевих кластерів – 7. Результати представлені на дендрограмі. На рисунку не підписані назви адміністративних одиниць, оскільки висока щільність первинних даних не дозволяє наочно їх відобразити.

Дендрограма кластеризації адміністративних одиниць України за поширеністю "рідних мов" серед населення

Дендрограма кластеризації адміністративних одиниць України за поширеністю “рідних мов” серед населення

 Середня поширеність мов для виділених кластерів показана нижче на діаграмі та в таблиці. Звертаю увагу читачів на те, що в мене відсутні первинні дані (кількість осіб, які вказали на конкретну рідну мову). Через це – середньоарифметичне значення для кожної мови вираховано з відсотків по кожному з районів і міст обласного значення. Це може бути не зовсім точним, оскільки відсотки – це вже усереднені дані. Але маємо, те що маємо…

Відсоткове поширення "рідних мов" у структурі населення для виділених мовних кластерів (середньоарифметичне значення)

Відсоткове поширення “рідних мов” у структурі населення для виділених мовних кластерів (середньоарифметичне значення)

Мова Відсоткова поширеність мов у виділених мовних кластерах (середньоарифметичне значення)
кластер 1 кластер 2 кластер 3 кластер 4 кластер 5 кластер 6 кластер 7
українська 24,56 97,97 93,50 90,57 72,10 88,52 21,21
російська 69,90 1,17 4,96 8,68 23,86 9,91 21,93
білоруська 0,15 0,04 0,10 0,28 0,12 0,20 0,06
болгарська 0,28 0,00 0,03 0,01 0,31 0,08 24,83
вірменська 0,15 0,02 0,07 0,07 0,11 0,34 0,06
гагаузька 0,01 0,00 0,05 0,02 0,02 0,03 4,85
кримсько-татарська (к_татарська) 7,30 0,01 0,00 0,01 0,00 0,02 0,00
молдовська 0,09 0,06 0,31 0,10 1,03 0,44 19,51
німецька 0,01 0,01 0,02 0,01 0,01 0,01 0,01
польська 0,01 0,03 0,12 0,01 0,03 0,01 0,01
циганська 0,08 0,05 0,06 0,07 0,10 0,08 0,12
румунська 1,38 0,28 0,04 0,01 1,58 0,01 1,19
словацька 0,00 0,02 0,04 0,01 0,10 0,00 0,00
угорська 0,00 0,47 0,98 0,01 0,68 0,02 20,06
караїмська 0,00 0,00 0,00 0,00 0,00 0,00 – – –
єврейська 0,00 0,01 0,01 0,01 0,01 0,00 0,00
грецька 0,07 0,00 0,00 0,01 0,01 0,01 0,17
русинська – – – 0,53 0,66 – – – 0,64 – – – 0,02

Я думаю, що після побудови діаграми і відображення – будь-які коментарі стосовно розділення населення на різні кластері зайві. Єдине, що можна додати – набагато точніші результати можна отримати за наявності саме первинних значень з перепису населення, а не усереднених відсотків.

Тепер нам необхідно показати географічне розташування виділених кластерів. Для цього я побудував картограму, на якій одиниці адміністративно-територіального устрою зафарбовані кольором відповідного кластеру, до якого вони потрапили. Картограма вказує на чітке географічне розділення кластерів № 1, 2, 6 та 7. Так, кластер №1, в якому суттєво переважає російськомовне населення, представлений районами та містами Криму, Приазов’я та Донбасу. Кластер №2 представлений, здебільшого в західній Україні. Окремо слід відзначити Краснодонський район Луганської області, який також потрапив до другого кластеру (із суттєвим переважанням україномовного населення). В цьому районі за результатами перепису населення 72,32% мешканців зазначили, що рідною для них є українська мова. Кластер №6 – найбільш “перемішані” громади. При домінуванні української мови тут також присутні російська, білоруська, вірменська, молдовська. І, нарешті, до кластеру №7 потрапили адміністративні одиниці з представниками народів дунайсько-балканського регіону. Тут найбільшу поширеність набули молдовська, болгарська, угорська, грецька мови; також присутні румунська та російська. Українська мова в цьому кластері має найнижче поширення серед всіх виділених сукупностей.

Розподіл кластерів в межах адміністративних одиниць України за співвідношенням "рідних мов" у структурі населення

Розподіл кластерів в межах адміністративних одиниць України за співвідношенням “рідних мов” у структурі населення

Leave a Comment