Інтерактивна візуалізація «Мандри криворізького бюджету — 3»

Візуалізація являє собою інтерактивну веб-сторінку. На сторінці зображено граф взаємодії при витрачанні бюджетних коштів установами, організаціями та підприємствами Кривого Рогу, які є розпорядниками бюджетних коштів.

Інтерактивна візуалізація «Мандри криворізького бюджету — 3» (скріншот сторінки)

ЄДРПОУ та повні назви розпорядників бюджетних коштів у Кривому Розі взято з великої кількості відкритих джерел. Зокрема — з Єдиного державного реєстру юридичних осіб, фізичних осіб–підприємців та громадських формувань. При цьому сам реєстр було отримано у формі відкритих даних з Єдиного державного порталу відкритих даних.
На візуалізації фігурують юридичні особи та фізичні особи-підприємці, які здійснювали сплату чи отримання коштів через Державне казначейство. Тобто — мали зафіксовану взаємодію з розпорядниками бюджетних коштів у Кривому Розі. В детальному описі кожного суб’єкта (вузла) описано з ким він взаємодіяв, скільки взагалі заплатив та отримав грошей (сумарно), кому платив бюджетні кошти, від кого отримував бюджетні кошти. Загалом було проаналізовано трохи більше ніж 314 тис. казначейських транзакцій. Візуалізація містить дані про взаємодію 4008 суб’єктів в межах часового проміжку 14.09.2015 — 25.02.2017. Загальна кількість візуалізованих зв’язків між цими суб’єктами становить 14622. У якості “зв’язку” брався сам факт взаємодії між суб’єктами, незалежно від кількості платежів між ними.
Візуалізація має засоби інтерактивного пошуку суб’єктів за назвою, ЄДРПОУ, прізвищем ім’ям та по-батькові. Підтримується «розумний пошук»: неповне введення слів та пошук за частиною слова. Оскільки візуалізація являє собою скомпільовану сторінку HTML із додатковими архівами даних, вона може бути скопійована на жорсткий диск комп’ютера та запущена в «офф-лайн» режимі. Для запуску в «офф-лайн» режимі треба розпакувати архів з набором файлів візуалізації та запустити через веб-браузер файл «index.html».
Для наглядності візуалізації розмір кола для кожного суб’єкту побудовано на базі десяткового логарифму від загальної суми заплачених та отриманих коштів. Також в рамках експерименту зроблено кластеризацію суб’єктів на підставі їхньої взаємодії в загальній мережі платників-отримувачів. Колір кола відображає приналежність до певного кластеру.

Для побудови візуалізації використано дані про платіжні транзакції, які публікуються на Офіційному порталі публічних фінансів України. Для отримання даних з порталу використовувався інтерфейс прикладного програмування (API). Отримані з порталу дані зберігались в єдину локальну базу даних. Первинну обробку та агрегацію даних виконано в середовищі мови програмування R. Зокрема, використовувались можливості пакетів RSQLite, dplyr, tidyr мови програмування R. Візуалізацію зв’язків здійснено за допомогою програмного засобу Gephi. Для експорту візуалізації в інтерактивну веб-форму використано додатковий плагін SigmaExporter програмного засобу Gephi. Часовий інтервал платежів – від 14 вересня 2015 до 25 лютого 2017 року. Назви підприємств отримано з Єдиного державного реєстру юридичних осіб, фізичних осіб–підприємців та громадських формувань. Деякі юрособи відсутні в державному реєстрі. У цьому разі їхня назва бралась із поля “Одержувач” платіжних транзакцій. Ця візуалізація характеризує не всі платежі, оскільки малу частину транзакцій (близько сотні) було усунуто з розрахунків, зокрема – транзакції з помилковими ЄДРПОУ/ІНН отримувачів. Через це – суми отриманих/заплачених коштів будуть трохи меншими, ніж суми коштів в первинній базі даних платіжних транзакцій.

Візуалізацію було опубліковано в лютому 2017 року у вигляді окремого розділу блогу www.datastory.org.ua. Повний архів з офф-лайн версією візуалізації можна завантажити тут.

Leave a Comment

%d блогерам подобається це: