Перевірка результатів голосування на відповідність закону Бенфорда

Закон “Першої значущої цифри”, або закон Бенфорда, знайшов широке застосування при дослiдженнi фальсифiкацiй найрiзноманiтнiших даних — вiд фiнансової звiтностi до геохiмiчних i геохронологiчних дослiджень. Застосування закону Бенфорда для викриття фальсифiкацiй результатiв виборчого процесу докладно описане в статтi У.Мебейна та К.Калiнiна “Электоральные фальсификации в России: комплексная диагностика выборов 2003–2004, 2007–2008 гг.”. У статтi, iз посиланням на результати, отриманих в тому числi й iншими дослiдниками, розглядаються декiлька методiв дослiдження електоральних даних.

Але в жодному iз розглянутих лiтературних джерел я не знайшов схеми дiї у випадку, коли першою значущою цифрою є нуль. З точки зору класичної методики, яка базується на законi Бенфорда — нуль не може бути першою значущою цифрою. На мою думку — це суттєвий недолiк цього методу: нуль може бути першою значущою цифрою, коли вимiрювання проведене, але показник не зафiксовано. Ми не можемо вiдкинути подiбнi значення, оскiльки вони пов’язанi iз iншими показниками, характеризуючи рiзнi властивостi того ж самого об’єкту. Для наших даних можна навести приклад: кiлькiсть голосiв за одного iз кандидатiв дорiвнює нулю.

Звiсно, що не можна вiдкинути такi записи, оскiльки вони являють собою зафiксований факт — вiдсутнiсть пiдтримки кандидата на данiй виборчiй дiльницi. Навiть, якщо ця нульова пiдтримка “сфабрикована” — факт залишається фактом.

Зважаючи на вищевикладене мною прийнято рiшення проводити дослiдження iз залученням повного масиву значущих цифр, включаючи нуль. Навiть при цiй невiдповiдностi спостерiгається дотримання закону Бенфорда.

Для створення псевдовипадкової послідовності значущіх цифр, відповідних закону Бенфорда, використано функцію rbenf пакету BenfordTests програмного середовища R. Графіку створено з використанням стандартних графічних інструментів середовища R.

Результати графiчного спiвставлення частостi першої значущої цифри в результатах голосування за кандидатiв та теоретичного розподiлу перших значущих цифр вiдповiдно до закону Бенфорда наведено на рисунках:

Співставлення першої значущої цифри кількості голосів за В.Ющенка із теоретичним розподілом відповідно до закону Бенфорда

Співставлення першої значущої цифри кількості голосів за В.Ющенка із теоретичним розподілом відповідно до закону Бенфорда

Співставлення першої значущої цифри кількості голосів за В.Януковича із теоретичним розподілом відповідно до закону Бенфорда

Співставлення першої значущої цифри кількості голосів за В.Януковича із теоретичним розподілом відповідно до закону Бенфорда

Співставлення першої значущої цифри кількості голосів "не підтримую жодного" із теоретичним розподілом відповідно до закону Бенфорда

Співставлення першої значущої цифри кількості голосів “не підтримую жодного” із теоретичним розподілом відповідно до закону Бенфорда

Як видно з графiкiв, лише результати голосування за кандидата “не пiдтримую жодного” вiзуально вiдрiзняються вiд теоретичного розподiлу. І я не виключаю штучне “обнулення” певної частини голосiв “проти всіх” на користь інших кандидатів. Тобто —  переброшування голосiв.

 Для перевiрки статистичної значущостi вiдхилення вибiркових та теоретичних кiлькостей значущих цифр мною застосовано критерiй χ2 Пiрсона. Результати перевiрки значущостi вiдхилення наведено в таблицi:

Параметри Ющенко Янукович “не підтримую жодного”
χ2 81,81  73,79  47,35
p-значення  0,2011  0,4149  0,9891
ступіні свободи  72  72 72

Але результати перевiрки показують на те, що в наших даних вiдсутнi статистично значущi вiдхилення вiд закону Бенфорда для перших значущих цифр в результатах голосування в третьому турі президентських виборів.

Leave a Comment

%d bloggers like this: