Электоральная математика на страже честных выборов
У січні цього року в колонці я наводив аналіз результатів голосувань на виборах 2010, 2012 та 2014 років.
Наразі за тією самою методологією пропоную аналіз результатів голосування 31 березня 2019 року за даними ЦВК на 4 квітня 2019 року.
На момент, коли було опрацьовано вже 100% бюлетенів.
Статистичний аналіз результатів голосування на окремих дільницях дозволяє:
- зробити висновки щодо рівномірності чи мінливості підтримки кандидата, не базуючись лише на одному числі – кінцевому результаті,
- дослідити залежності між підтримкою різних пар кандидатів.
Зрештою, аналіз аномалій щільності розподілу голосів по дільницях та їхньої залежності від явки є одним з найкращих механізмів виявлення потенційних фальсифікацій.
Аналіз статистичних властивостей вибірок результатів голосування
Почнемо з аналізу статистичних властивостей вибірок результатів голосування на 29989 виборчих дільницях, яка наведена в наступній таблиці.
Це дозволяє не лише побачити остаточні результати волевиявлення, які наведені на сайті ЦВК, але зрозуміти, як розподілені результати за окремими виборчими дільницями.
Так, загалом за Порошенка проголосували 15.95% виборців України, і це майже те ж саме, що й середній результат на дільницях – 15.9%.
А от у випадку Тимошенко її загальний результат 13.40%, але якщо усереднити результати по окремих дільницях, то це 16.2%.
Чому така відмінність? Справа в тому, що дільниці мають різну кількість виборців. У випадку Тимошенко вона отримала кращі результати на більшій кількості невеличких дільниць, тоді як Зеленський, навпаки, мав більшу підтримку на дільницях зі значним числом виборців.
Ще цікавішим показником є медіана, пояснимо її зміст на прикладі Порошенка.
Медіана 13.5% говорить про те, що на 50% дільниць за Петра Олексійовича віддали голоси менш ніж 13.5% виборців, а на 50% дільниць – понад 13.5% виборців.
Коли ми бачимо, що середній результат суттєво відрізняється від медіани, це вказує на наявність суттєвої кількості дільниць, на яких підтримка кандидата або дуже низька, або дуже велика.
Це свідчить про географічну нерівномірність підтримки кандидата. Краще, коли медіана знаходиться близько до середнього, у такому разі підтримка виборців на різних дільницях є більш рівномірною.
Нарешті, можна вимірювати неоднорідність підтримки кандидата за такими показниками, як стандартне відхилення, 90% інтервал (тобто діапазон голосів, які отримав кандидат, якщо відкинути по 5% дільниць з найкращими та найгіршими його чи її результатами) та коефіцієнт варіації.
Останній показник дозволяє порівнювати мінливість підтримки різних кандидатів – бачимо, що в Зеленського вона є найбільш сталою, тоді як у Порошенка – більш мінлива.
Кореляція і щільність розподілу явки виборців
Позитивна кореляція між парою кандидатів вказує на те, що на одних і тих самих дільницях обидва зазвичай мали або дуже добру, або дуже погану підтримку.
Від'ємна кореляція, навпаки, свідчить, що там, де один кандидат набирав багато голосів, інший не мав підтримки виборців.
Аналіз кореляції дозволяє виявляти електоральні кластери та робити висновки щодо того, чому виборці підтримують ту чи іншу групу кандидатів.
Відразу помічаємо цікаву залежність результатів кандидатів від явки – вона від'ємна для Бойка, Вілкула та Зеленського, що може свідчити про системне голосування за цих кандидатів з боку осіб, що незадоволені нинішніми правлячими силами.
У таких осіб завжди є вибір – або проголосувати за несистемного кандидата, або взагалі проігнорувати голосування.
З іншого боку, маємо цікаві пари антагоністів: Бойко–Тимошенко та Зеленський–Порошенко. Звісно, обидва лідери перегонів мають від'ємну кореляцію з суперником.
Природно також виглядають пара Бойко-Вілкул та трійця Гриценко-Кошулинський-Порошенко, вони чітко відображають регіональні вподобання виборців.
Дещо більш загадковою є кореляція між результатами Ляшка та Тимошенко, яка, до речі, зберігається з 2014 року.
Щільність розподілу явки на виборчих дільницях виглядає досить природно – майже нормальний розподіл без артефактів, які свідчили би про факти масового завищення явки.
Є лише деякий горб на рівні 77-78% та вже відомий феномен дільниць зі 100% явкою, який є наочною ознакою грубого порушення законодавства, оскільки математично неймовірним є бажання 100% виборців у межах дільниці голосувати (завжди є ймовірність, що 1-2 особи не бажають цього робити).
Так, виборчий округ № 29, дільниця № 121049 – проголосували всі 1406 виборців. Це місто Дніпро, школа № 116.
Є такі ганебні факти й у Києві – виборча дільниця № 801053, міська клінічна лікарня № 16, хол, 3-й поверх – проголосували всі 65 осіб. Або виборча дільниця № 800949, міська клінічна лікарня № 6 – проголосували всі 165 осіб. Виникає підозра щодо примусу пацієнтів голосувати.
Додамо ще дільниці з явкою понад 99%. Виборчий округ № 174, спеціальні дільниця № 1 – Харківський слідчий ізолятор. З 1910 осіб проголосували 1901. Чи не було примусу з боку адміністрації ізолятору? Чи не зазнали утиску ті 9 осіб, що не голосували на цій дільниці?
Такі факти потрібно розслідувати.
Загалом маємо 338 дільниць зі 100% явкою та ще 57 дільниць з явкою від 99% до 100%. Я вважаю, що правоохоронні органи повинні відкрити за кожним таким фактом кримінальне провадження та виявити всі обставини такої підозрілої явки.
Щільність розподілу результатів голосування за окремих кандидатів
Тепер перейдемо до щільності розподілу результатів голосування за того чи іншого кандидата на виборчих дільницях.
Графіки виглядають дуже добре, жодних "великих хвостів" праворуч чи "плато" у правому хвості. Майже не спостерігається також характерних піків на круглих значеннях результатів (скажімо, 40%, 50% тощо). Це свідчить про малу ймовірність фальсифікацій.
Однак є один з кандидатів, в якого спостерігається артефакт. Це Петро Порошенко.
Я спеціально наведу окремі графіки щільності розподілу голосів за Зеленського, Порошенка та Тимошенко, щоб читачі могли наочно побачити цю особливість на другому з них:
Хоча розподіл голосів за Порошенка, ймовірно, складається з декількох компонентів – так, можна казати про один розподіл з центром на рівні 10% та інший з центром 20-25% – але все одно неприродною є щільність голосів між 40% та 50%. В інших кандидатів такого не спостерігається.
Залежність голосів від явки
Далі розглянемо залежність голосів від явки. Такий тип графіку може показати вкидання бюлетенів, якщо для окремного кандидата правий хвіст розподілу буде суттєво відрізнятись від типового вигляду. На загальному графіку ми цієї особливості майже не помічаємо, для всіх кандидатів у цілому графіки виглядають добре.
Але якщо уважно придивитись до графіку Порошенка, то знов маємо неприємні артефакти.
Перший з них – на рівні 70%, його краще навіть можна побачити на прикладі таблиці, де наведена кількість голосів за різних рівнів явки.
Для Порошенка на рівнях явки між 67% та 70% бачимо плато, якого не може бути теоретично й якого не спостерігаємо в інших кандидатів.
Я в останньому стовпчику змоделював розподіл голосів за Порошенка в діапазоні 68%–75%, який виглядає більш природно – з цієї моделі випливає, що близько 50 тис. голосів, можливо, було вкинуто.
Але, за великим рахунком, такі вкидання голосів загалом могли додати Порошенкові від 0.3% до 0.5% голосів. Тому навіть якщо вкидання за Порошенка й були, це не вплинуло суттєво на результати.
Висновки
Таким чином, можна зробити загальний висновок, що перший тур виборів пройшов досить чесно.
Наведений аналіз опублікованих ЦВК результатів голосування не свідчить про жодні факти масштабних фальсифікацій, які могли би викривити результати волевиявлення.
Ми бачимо, що підтримка Порошенка та Зеленського обумовлена, перш за все, голосуванням на великих дільницях, тоді як Тимошенко мала більшу підтримку на невеличких дільницях, і це не дозволило їй перейти у другий тур.
Підтримка Порошенка є більш мінливою, тоді як результати Зеленського розподілені більш рівномірно.
Але для нас як для громадянського суспільства важливіші не конкретні висновки по персоналіях, а забезпечення чесних і прозорих виборів без можливості викривити результати народного волевиявлення, задля чого власне й застосовуються статистичні методи аналізу.
Валентин Хохлов, CFA, спеціально для УП
Ілюстрації автора