Електоральна математика: як розпізнати порушення на виборах 2019

Четвер, 24 січня 2019, 13:30

член правління ГО "Українська альтернатива"

У 2019 році в Україні відбуватимуться президентські та парламентські вибори. Тому саме час поговорити про те, як застосування математичної статистики може допомогти у виявленні зловживань під час голосування.

Використовуючи результати президентських і парламентських виборів 2010, 2012 і 2014 років, я проаналізував деякі аспекти і пропоную короткі висновки.

Математичний бекграунд

Результати волевиявлення кожної окремої людини (голосування за кандидата, проти всіх, псування бюлетеня, неучасть у голосуванні) можна описати за допомогою інструментів теорії ймовірностей, а саме розподілу Бернуллі.

Якщо результати волевиявлення людей є незалежними, тобто кожен голосує на власний розсуд, то сума голосів за кандидатів, а також відсоток таких голосів та явка матимуть певні властивості.

На великих вибірках (від 1000 голосів) за умови незалежності графік щільності ймовірності того чи іншого результату має виглядати як дзвоноподібна крива (вона ж колоколоподібна), що відповідає нормальному розподілу (він же розподіл Ґауса).

Відхилення від цього можуть свідчити про порушення незалежності голосування чи штучне викривлення його результатів.

Але є велике обмеження – якщо електоральні настрої не гомогенні, тобто існує регіональна специфіка, то матимемо окремі кластери з різними розподілами голосів. Тоді його щільність у межах України в цілому може мати інший вигляд, зокрема декілька глобальних піків у центральній частині графіку, але у хвостах щільність у будь-якому разі має поступово і без суттєвих коливань спадати до нуля.

Як викривлення результатів волевиявлення можуть виглядати на графіках?

"Намальовані результати", коли у протокол дільничної комісії вносяться штучні дані, які не відповідають результатам голосування. Відстежити це можна, коли існують якість цільові результати або діапазони, які "спускаються згори" відразу на значну кількість комісій (наприклад, з 30 тис. виборчих дільниць в Україні на 500-600).

У тих діапазонах, де розташовані "намальовані" результати, щільність розподілу голосів за кандидата, на користь якого це робиться, буде штучно завищеною відносно інших діапазонів.

На графіку щільності розподілу це виглядає як неприродні піки на якихось рівнях. Класичний приклад – вибори у Саратовській області у 2016 році, коли на кожній шостій дільниці "Єдина Росія" отримала 62,2% голосів (пік між 62% та 63%).

Неправильний підрахунок, коли бюлетені за одного кандидата при підрахунку зараховують як голоси за іншого.

Це теж має на меті отримання якогось конкретного результату для того кандидата, для якого робляться підтасовки.

Наприклад, якщо у середньому A має 30%, B має 40%, і на значній частині дільниць половина бюлетенів з голосами за A буде врахована як голоси за B, то штучно підвищиться ймовірність розподілу голосів за A у діапазоні 15-30%, а за B – 40-55%.

На графіку щільності розподілу для B це буде виглядати як підвищений "правий хвіст" розподілу (візуально виглядає як плече або плато). Ми це побачимо на прикладі Януковича у 2010 році.

Вкидання невикористаних бюлетенів або "каруселі". Цим одночасно вирішуються дві задачі – штучно підвищується явка, та все це підвищення явки транслюється у голоси за "потрібного" кандидата.

На відміну від попередніх зловживань, це не може забезпечити якійсь конкретний відсоток голосів (оскільки невідомо заздалегідь, скільки голосів було до вкидань). Тому воно не відображається як піки на графіку щільності.

Але його легко можна відстежити, якщо побудувати залежність голосів за кандидатів від явки – оскільки вкидання одночасно збільшують явку та голоси за одного з кандидатів, то вони візуально помітні як збільшений правий хвіст на графіку. Це можна буде досить добре спостерігати на результатах "Партії регіонів" у 2012 році.

І ще одне, що у нас чомусь не вважається порушенням. Це дільниці з явкою під 100%. Так, у 2014 році на виборах президента було 324 дільниці з явкою 99% і більше, з них 254 дільниці зі 100% явкою. Зрозуміло, що за теорією ймовірностей, це нереально. Графічно бачимо пік явки у діапазоні 99-100%.

Додати до цього те, що на деяких з таких дільниць переважання одного з кандидатів суттєво відрізняється від того, що спостерігається в Україні в цілому.

Це свідчить про застосування адмінресурсу на таких дільницях, тому будь-які дільниці з явкою понад 99% мають бути обов'язково предметом розслідування на предмет порушення виборчого законодавства.

Наведу деякі з таких дільниць: округ 11 ВД 1, 51577 і 51579, округ 21 ВД 71022, округ 23 ВД 70731, округ 79 ВД 230691, округ 80 ВД 230414, округ 86 ВД 260615, округ 126 ВД 461432 і 461435, округ 167 ВД 610493, округ 177 ВД 630370, округ 192 ВД 681138, округ 222 ВД 800954.

Графіки

Почнемо з першого туру президентських перегонів 2010 року. Щільність розподілу голосів за Тігіпка не викликає жодних підозр.

Перший тур президентських перегонів 2010 року. Розподіл голосів за окремого кандидата

всі ілюстрації надані автором

Розподіл голосів за Тимошенко має декілька вершин, що пояснюється регіональною специфікою (є багато дільниць з 5-10% голосів і багато з 35-40% голосів). Але зверніть увагу на локальний пік на рівні 50% – він виглядає штучним, на відміну від 40%.

Розподіл голосів за Януковича теж, імовірно, має регіональну специфіку (десь він мав 10-20% голосів, а десь 50-70%), але ось це довге плече на графіку праворуч викликає підозри. Зверніть також увагу на локальні піки на рівнях 50%, 60%, 70%.

Порівняємо наведений вище графік з щільністю розподілу голосів на президентських виборах 2014 року.

Президентські вибори 2014 року. Щільність розподілу голосів за окремого кандидата

Графіки для всіх кандидатів, окрім Порошенка, виглядають взагалі бездоганно.

Щодо Порошенка, в цілому, розподіл голосів за нього не є дуже підозрілим. Центральне плато можна пояснити тим, що були регіони, де він мав 45-50% голосів, а в інших було 60-65%.

Плеча праворуч немає, і це добра ознака. А ось локальні піки на рівнях 50%, 55%, 60% можуть свідчити про окремі підтягування результатів.

Наступний графік – залежність результатів першого туру президентських виборів 2010 року від явки на дільницях. Вона виглядає цілком природно.

Перший тур президентських виборів 2010 року. Залежність результатів від явки на дільницях

Єдине виключення – дільниці зі 100% явкою, на яких голоси мали або Тимошенко, або Янукович, але не Тігіпко.

Це підтверджує припущення про те, що явка 100% є ознакою застосування адмінресурсу на користь одного з фаворитів.

Порівняємо залежність кількості голосів за окремих кандидатів від явки на президентських виборах 2014 року.

Президентські вибори 2014. Залежність кількості голосів за окремих кандидатів від явки

Теж все дуже коректно, крім дільниць зі 100% явкою. На них знову маємо голоси за Тимошенко чи Порошенка, але не за інших кандидатів.

Перейдемо до парламентських виборів. На перегонах 2012 року маємо досить дивний великий правий хвіст розподілу голосів за "Партію регіонів" – порівняйте з тим, як ведуть себе праві хвости розподілів для інших партій, вони спадають швидше. Пояснення цього феномену для "Партії регіонів" отримаємо нижче.

На цьому графіку не дуже добре помітно, але ця партія має локальні піки на рівнях 40%, 50%, 60%, 71% (!) та 75%. У Батьківщини маємо піки на рівнях 40%, 45% і 50%.

Парламентські вибори 2012. Щільність розподілу голосів за окрему політсилу

Порівняємо з щільністю розподілу на парламентських виборах 2014 року.

Лише "Народний фронт" мав локальні піки, але не у правому хвості, тому вони не викликають великої підозри – немає великого сенсу підмальовувати результати на рівні 20%.

А правий хвіст виглядає природнім для розподілів голосів усіх політичних сил.

Парламентські вибори 2014. Щільність розподілу голосів за окрему політичну партію

Перейдемо до аналізу залежності результатів голосування за окремі політичні сили від явки. У 2012 році одразу ж помічаємо ознаки вкидань – це ненульовий правий хвіст на графіку для "Партії регіонів".

Якщо в усіх інших випадках при зростанні явки до 99% (рівень 100% – окремий випадок) графік прямує до нуля, до лише у 2012 році та лише для "Партії регіонів" це не так. На рівнях явки 90% і вище ми бачимо голоси лише за "Партію регіонів".

Згадаємо великий правий хвіст на графіку щільності розподілу – одночасне збільшення явки та голосів за окрему політичну силу свідчить про те, що мали місце вкидання бюлетенів за неї.

Парламентські вибори 2012. Залежність результатів голосування за окремі політичні сили від явки

І порівняємо залежність результатів голосування від явки на парламентських виборах 2014 року.

Всі розподіли поводять себе однаково і великого правого хвосту, як на попередньому графіку, ми не спостерігаємо.

Парламентські вибори 2014. Залежність результатів голосування від явки

Наведені графіки дають змогу побачити, як можна розпізнати підозру щодо тих чи інших порушень у ході голосування чи підрахунку голосів.

Застосування такого інструментарію на виборах 2019 року, а також суспільний контроль над голосуванням на дільницях із майже 100% явкою може забезпечити більш чесні та прозорі вибори у нашій країні.

Валентин Хохлов, CFA, спеціально для УП