Порівняння результатів голосування на відповідність закону Бенфорда

За даними голосування по виборчих дільницях, опублікованими на сайті ЦВК, я вирішив перевірити результати голосування на відповідність закону Бенфорда. Цей закон, як його ще називають – “закон першої цифри”, часто використовують для перевірки достовірності фінансових та електоральних даних.

Для аналізу мною відібрано подільничі результати голосування за партії-фаворити (ті, які пройшли 5-ти відсотковий бар’єр) і за ВО Свобода та Компартію. Результати графічного порівняння приведені нижче. “Фактична частість” – це частість перших значущих цифр у результатах голосування за конкретну політичну силу; “теоретична частість” – це частість цієї цифри відповідно до закону Бенфорда. Перед обчисленням теоретичної частості і побудовою графіків я видалив всі випадки, коли за конкретну політичну силу на дільниці проголосувало нуль осіб. Через це кількість значень для різних політичних сил трохи відрізняється.

Відповідність даних з голосування за НАРОДНИЙ ФРОНТ теоретичному розподілу за законом Бенфорда

Відповідність даних з голосування за НАРОДНИЙ ФРОНТ теоретичному розподілу за законом Бенфорда

Відповідність даних з голосування за БЛОК ПЕТРА ПОРОШЕНКА теоретичному розподілу за законом Бенфорда

Відповідність даних з голосування за БЛОК ПЕТРА ПОРОШЕНКА теоретичному розподілу за законом Бенфорда

Відповідність даних з голосування за Об’єднання САМОПОМІЧ теоретичному розподілу за законом Бенфорда

Відповідність даних з голосування за Об’єднання САМОПОМІЧ теоретичному розподілу за законом Бенфорда

Відповідність даних з голосування за Опозиційний блок теоретичному розподілу за законом Бенфорда

Відповідність даних з голосування за Опозиційний блок теоретичному розподілу за законом Бенфорда

Відповідність даних з голосування за Радикальну Партію Олега Ляшка теоретичному розподілу за законом Бенфорда

Відповідність даних з голосування за Радикальну Партію Олега Ляшка теоретичному розподілу за законом Бенфорда

Відповідність даних з голосування за ВО Батьківщина теоретичному розподілу за законом Бенфорда

Відповідність даних з голосування за ВО Батьківщина теоретичному розподілу за законом Бенфорда

Відповідність даних з голосування за ВО Свобода теоретичному розподілу за законом Бенфорда

Відповідність даних з голосування за ВО Свобода теоретичному розподілу за законом Бенфорда

Відповідність даних з голосування за Комуністичну партію України теоретичному розподілу за законом Бенфорда

Відповідність даних з голосування за Комуністичну партію України теоретичному розподілу за законом Бенфорда

Як видно з графіків – лише для Радикальної Партії Олега Ляшка та ВО Батьківщина спостерігаються відхилення фактичних частостей перших значущих цифр від теоретичних частостей. Але щоб довести можливі фальсифікації нам необхідно пересвідчитись, що подібні відхилення не випадкові і дійсно обумовлені “зовнішнім втручанням” у природне життя цих цифр. Для перевірки я використав критерій Пірсона хі-квадрат.

Порівняння проводилось із псевдовипадковою вибіркою тотожної довжини, отриманою за допомогою функції rbenf пакету BenfordTests. В отриманій вибірці було залишено лише перші значущі цифри (відкинуто дробову частину). Первинний стан генератора псевдовипадкових послідовностей встановлено 20141026 (дата парламентських виборів). Це значення може стати у нагоді, якщо хтось із читачів захоче перевірити мої розрахунки. Результати перевірки представлено в таблиці.

Політична сила Кількість ненульових значень хі-квадрат ро-значення Ступіні свободи
НАРОДНИЙ ФРОНТ 29521 58.0908 0.6843 64
БЛОК ПЕТРА ПОРОШЕНКА 29579  61.7523  0.5564 64
Об’єднання САМОПОМІЧ 28441  42.5568  0.9822  64
Опозиційний блок 27236  70.7035  0.2639 64
 Радикальна Партія Олега Ляшка 29466 54.9854  0.7817  64
 ВО Батьківщина 29388  49.4615 0.9095 64
 ВО Свобода 28151  46.3058  0.9532 64
 Комуністична партія України 25556  68.7273 0.3204 64

 Як видно із таблиці – в жодному з наведених випадків ми не можемо відхилити нульову гіпотезу і сказати, що результати голосування за кожну з політичних сил не відповідають закону Бенфорда – досягнутий рівень значущості (ро-значення) не дає нам такої підстави. Отже, не дивлячись на підозрілі рисунки, ми не можемо прямо вказати на можливість фальсифікацій результатів виборів. Можливо, треба застосувати більш гнучкі методи аналізу.

Leave a Comment

%d bloggers like this: