Как теория игр может помочь нашему обществу?
Автори:
Владислав Рашкован, заступник Виконавчого директора МВФ
Олексій Ігнатенко, доктор фізико-математичних наук, професор УКУ
Один з авторів цієї колонки спеціалізується на теорії ігор вже більше 30 років, а інший хоч і любив математику в школі і в університеті, але таланту стати математиком в нього не вистачило.
Один є економістом, якому завжди було цікаво зрозуміти математику, яка стояла за тою чи іншою економічною або фінансовою моделлю, яку він вивчав. На третьому курсі вишу він самотужки намагався зрозуміти ідеї Джона фон Неймана та Оскара Моргенштерна, а потім й Джона Неша, який отримав Нобелівську премію за теорію ігор. Другий же сам викладає ці теми в декількох вишах, зокрема в УКУ та Могилянці.
Одному автору в своїй роботі ані в комерційному секторі, ані в НБУ або МВФ особливо не доводилося використовувати інструментарій теорії ігор, що дуже прикро. Інший же регулярно і професійно проводить популярні лекції про використання теорії ігор в різних сферах.
Що ж об’єднує двох авторів? Насправді вони обидва думають, що теорія ігор повинна стати обов'язковим інструментом як мінімум для системи прийняття рішень на рівні державних політик з кількох ключових причин.
По-перше, теорія ігор надає унікальний аналітичний апарат для моделювання складних взаємодій між різними суб'єктами суспільства. У світі, де інтереси держави, громадян, бізнесу, громадських організацій та міжнародних партнерів часто переплітаються та конфліктують, теорія ігор дозволяє передбачити можливі наслідки політичних рішень та стратегій.
Вона допомагає виявити потенційні "рівноваги" – стабільні стани системи, де жоден з учасників не має стимулу змінювати свою поведінку в односторонньому порядку. Також важливо відділити ефективні рівноваги від інших та зрозуміти, які рівноваги є більш реалістичними для досягнення людьми.
Це особливо важливо при розробці економічної політики, регуляторних механізмів та міжнародних угод, де розуміння стимулів та можливих реакцій всіх залучених сторін є критичним для досягнення бажаних результатів.
Теорія ігор також пропонує інструменти для побудови стратегій оптимізації суспільного блага в умовах обмежених ресурсів. Різні моделі можуть допомагати визначати ситуації, в яких неможливо покращити становище одного учасника без погіршення становища іншого. Такі моделі надають основу для пошуку компромісів та балансування різних суспільних інтересів.
Крім того, механізми, розроблені на основі теорії ігор можуть бути використані для ефективного розподілу суспільних ресурсів, забезпечуючи максимальну корисність для суспільства в цілому. Такий підхід актуальний, наприклад, для вирішення питань клімату або управління природними ресурсами. При вирішенні таких завдань теорія ігор надає цінні інсайти щодо того, як створити стимули для кооперації.
Нарешті, застосування теорії ігор у державному управлінні сприяє більш системному та стратегічному підходу до прийняття рішень, змушуючи політиків та держслужбовців враховувати довгострокові наслідки своїх дій та передбачати можливі реакції на них інших економічних агентів. Використання теорії ігор потенційно може допомогти уникнути короткозорих політичних рішень, які можуть мати негативні довгострокові наслідки.
Це все в теорії. А які інструменти теорії ігор точно варто використовувати на практиці і як? Насправді інструментів безліч: Кооперативні ігри, механізм Вікрі-Кларка-Гроувса, теорема Коуза, модель олігополії Курно, аукціони Вікрі, теорема неможливості Ерроу, тощо. В цій колонці хочу затронути три інші концепції: рівновагу Неша, Парето-оптимальність та рівновагу за Штакельбергом, та показати, як їх застосування на рівні держави дозволяє прагнути максимізації суспільного блага.
Рівновага Неша
Рівновага Неша – це ситуація в грі (по суті, ситуація – це набір стратегій гравців), в якій кожна людина в групі робить те, що найкраще для себе, враховуючи те, що роблять інші. При цьому ніхто не може покращити свій стан, змінюючи лише свої власні дії.
Щоб пояснити цей концепт дуже просто, уявіть собі, що троє сусідів мають вирішити (кожен окремо) як їхати на роботу – машиною чи автобусом. Їхні виграші залежать від рішень всіх трьох. Кожен з них має свою оцінку зручності машини: для першого виграш дорівнює 6, для другого 4 і для третього 2. Якщо ж вони їдуть автобусом, то їх виграш залежить від кількості людей у автобусі (бо вони можуть спілкуватись і не кермувати): якщо їде лише один, то його виграш 1, якщо двоє, то вони виграють по 3 і, нарешті, якщо всі їдуть автобусом, то їх виграш по 5. Як ви думаєте хто поїде яким транспортом?
В цій грі кожен обирає стратегію сам, але він має враховувати виграші інших – це називається мислити стратегічно. Припустимо, всі троє їдуть автобусом і отримують по 5, але перший гравець може покращити свій виграш, обравши їхати машиною. Але тепер, в цій новій ситуації, уже другому вигідно відхилитись і отримати 4, а не 3. І нарешті останньому гравцю теж виходить краще їхати машиною. Це приклад рівноваги Неша, яка не є ефективною – сума виграшів гравців у рівновазі є суттєво меншою за найкращу можливу, якби вони могли домовитись.
Рівновага Неша настає тоді, коли ніхто не шкодує про свій вибір і не хоче його змінити, знаючи вибір інших. Але ключове в моделі: кожен робить те, що найкраще саме для нього/неї.
Які приклади цієї рівноваги є в щоденному житті? Наприклад, при виборі дороги на роботу водії часто обирають певні маршрути, потенційно розуміючи вибір інших. Якщо всі обирають найкоротший шлях, він скоро стає перевантаженим, і виникає рівновага, де ніхто не може покращити свій час у дорозі, змінюючи маршрут самостійно. Обираючи час для покупок, люди часто намагаються уникати годин пік у магазинах. Це призводить до рівноваги, де покупці розподіляються більш-менш рівномірно протягом робочого дня магазину.
У кафе відвідувачі часто обирають місця, максимізуючи особистий комфорт (наприклад, подалі від шумних груп чи ближче до вікна), що призводить до певного розподілу клієнтів по залу. Обираючи одяг для вечірки, гості часто враховують очікування щодо вбрання інших. Це може призвести до рівноваги, де всі одягнені приблизно з однаковим рівнем формальності.
Але як концепція рівноваги Неша впливає на суспільство в цілому? Насамперед треба зрозуміти, що рівновага Неша створює модель певної стабільності. У економіці, політиці чи соціальних відносинах, коли досягнуто такої рівноваги, ніхто не має стимулу односторонньо змінювати свою поведінку. Це може призводити до передбачуваності та зменшення хаосу в суспільних системах. Наприклад, усталені бізнес-практики в певній галузі можуть тривалий час залишатися незмінними, оскільки жодна компанія не бачить вигоди у відхиленні від норми.
Рівновага Неша також висвітлює напруження між конкуренцією та співпрацею в суспільстві. З одного боку, конкурентна поведінка часто призводить до рівноваги Неша, що може стимулювати інновації та ефективність. З іншого боку, така рівновага може перешкоджати кооперації, яка могла б принести кращі результати для всіх учасників. Це особливо помітно у глобальних викликах, таких як зміна клімату, де країни часто не можуть домовитися про спільні дії, хоча це було б вигідно для всіх.
Розуміння концепції рівноваги Неша є ключовим для розробки ефективної державної політики. Уряди можуть використовувати це розуміння для створення стимулів, які зміщують рівновагу в бік більш сприятливих для суспільства результатів. Наприклад, впровадження податків на забруднення може змінити рівновагу в промисловості на користь більш екологічних практик.
Інші приклади застосування рівноваги Неша в державній політиці включають, наприклад, ситуації, коли уряд розробляє антимонопольне законодавство, яке запобігає формуванню монополій і підтримує конкурентне середовище на ринку; або коли під час пандемії держава розробляла стратегію вакцинації, пропонуючи обов'язкову вакцинацію для певних груп населення. Така стратегія була спрямована на зміну рівноваги на користь більшого охоплення населення. Впровадження систем оплати за в'їзд до центру міста (як у Лондоні) змінює рівновагу у виборі транспорту, заохочуючи використання громадського транспорту.
У соціальній сфері рівновага Неша може пояснити стійкість певних норм та звичаїв, навіть якщо вони не є оптимальними. Соціальні домовленості, такі як dress code в офісі, можуть зберігатися тривалий час, оскільки нікому не вигідно порушувати їх поодинці.
В цілому розуміння цієї концепції може допомогти у розробці більш ефективних стратегій та політик, які враховують індивідуальні стимули, але при цьому прагнуть до кращих колективних результатів. У світі, що стає все більш взаємопов'язаним, такий підхід до розуміння суспільних процесів стає все більш важливим.
Парето-оптимальність
Однак, рівновага Неша має свою ціну, тому що часто така ситуація в грі не є оптимальною для суспільства в цілому. Класичний приклад – "дилема в'язня", де два підозрюваних, які діють у власних інтересах, обирають стратегії, які призводять до гірших результатів для обох. У реальному житті це може проявлятися у надмірному використанні спільних ресурсів, забрудненні довкілля чи інших ситуаціях, де переслідування власної вигоди шкодить загальному благу.
В теорії ігор існує інший концепт, який враховує ідею загальної ефективності системи та максимізації суспільної, а не індивідуальної вигоди. Цей концепт називається "Парето-оптимальність" або "Парето-ефективність", яка досягається в стані, при якому неможливо покращити виграші будь-якого учасника, не погіршивши при цьому виграш хоча б одного іншого учасника.
Уявити собі це дуже легко: візьміть розподіл пирога між двома людьми. Будь-який розподіл, де весь пиріг розділений між ними (наприклад, 70/30, 50/50, 40/60), є Парето-оптимальним, оскільки неможливо покращити становище однієї людини, не погіршивши становище іншої. Важливо зазначити, що Парето-оптимальність не обов'язково означає "справедливість" чи "рівність". Вона лише вказує на ефективність розподілу з точки зору загальної користі.
Парето-оптимальний розподіл ресурсів у бюджеті країни означав би, що неможливо перерозподілити кошти на освіту, охорону здоров'я чи інфраструктуру таким чином, щоб покращити одну сферу, не зашкодивши іншій. Знову ж таки це не обов'язково означало би справедливий розподіл.
Ключова відмінність між цими рівновагою за Нешем та Парето-ефективністю полягає в їхньому фокусі та результатах. Парето-оптимальність зосереджена на загальній ефективності системи, тоді як рівновага Неша – на індивідуальних стратегіях. Рівновага Неша є стабільною, оскільки ніхто не має стимулу змінювати свою стратегію. Парето-оптимальний стан може бути нестабільним без зовнішнього регулювання. Досягнення Парето-оптимальності часто вимагає співпраці, тоді як рівновага Неша може виникнути в конкурентному середовищі самостійно, без домовленостей між гравцями.
Напрямок досліджень, який намагається зрозуміти як потрібно перебудувати гру, щоб рівновага Неша була також Парето-ефективною (або хоча б близькою до цього) називається теорією дизайну механізмів. Це особливо важливо в сучасному світі, де інформаційні системи проникли в усі сфери людської діяльності, а деякі, наприклад, соціальні мережі, визначають майбутнє. В таких системах невеликі зміни у правилах роботи (тобто у структурі такої гри) можуть призвести до масштабних змін у житті людей, перетворюючи хорошу рівновагу у погану. Невеликі зміни у правилах вибору постів у фейсбуці можуть вплинути на інформацію, яку бачать люди, та впливати на їх політичні уподобання. Ми спостерігаємо у "прямому ефірі" як згенеровані ШІ картинки і тексти захоплюють стрічку і наразі рішення протидії цьому впливу не видно.
Розуміння цих концепцій має важливе значення для розробки ефективної державної політики. Наприклад, при розробці податкової системи уряд може прагнути до Парето-оптимального рішення, яке максимізує загальний добробут, але повинен враховувати, що індивідуальні платники податків будуть діяти відповідно до своїх власних інтересів, що може призвести до рівноваги Неша.
У сфері міжнародних відносин, наприклад у питаннях кліматичної політики, країни часто опиняються в ситуації рівноваги Неша, де кожна діє у власних інтересах. Однак для досягнення Парето-оптимального результату, який би максимізував глобальну користь, необхідна міжнародна співпраця та угоди типу Кіотського протоколу.
Як результат, рівновага Неша допомагає нам зрозуміти, як люди можуть діяти у власних інтересах, концепція Парето-оптимальності надає інструмент для аналізу та прагнення до кращих колективних результатів. Розуміння обох концепцій та їх взаємодії є ключовим для створення політик та систем, які ефективно балансують індивідуальні стимули та суспільне благо.
Рівновага за Штакельбергом
Рівновага за Штакельбергом – ще одна цікава концепція з теорії ігор, яка може мати важливі наслідки для суспільства. На відміну від рівноваги Неша, де всі гравці діють одночасно, або Парето-оптимальності, яка фокусується на загальній ефективності, рівновага за Штакельбергом описує ситуацію, де один гравець (лідер) робить свій хід першим, а інші (послідовники) реагують на цей хід. Це створює динамічну гру, де лідер може мати деяку стратегічну перевагу, оскільки може передбачити реакцію послідовників.
Насправді ми дуже часто бачимо застосування принципів цієї рівноваги в нашому житті. Наприклад, коли один з друзів (лідер) пропонує на вечерю конкретний ресторан, а інші друзі (послідовники) погоджуються (або навіть коли пропонують альтернативи, вони враховують першу пропозицію). В результаті вибір часто схиляється до першої пропозиції, якщо немає сильних заперечень.
Або коли ви обираєте фільм для перегляду з сім’єю: один з членів сім’ї (лідер) пропонує конкретний фільм, а інші члени сім'ї (послідовники) реагують, погоджуючись або пропонуючи альтернативи. В результаті перша пропозиція часто має перевагу, якщо немає сильних заперечень.
В бізнесі ми бачимо цей приклад ще частіше, особливо в сфері інновацій. Спочатку Apple (лідер) випускає новий iPhone з інноваційним дизайном, а потім інші виробники-послідовники (Samsung, Huawei) адаптують свої продукти, включаючи схожі функції. Як результат, Apple отримує перевагу першопрохідця, встановлюючи нові стандарти ринку. Схожа ситуація була і є у Tesla при виробництві електромобілів.
Часто ми бачимо такий підхід в цінових війнах. Наприклад, одна з мереж супермаркетів оголошує про зниження цін на певну категорію товарів, а інші мережі змушені реагувати, також знижуючи ціни. В результаті лідер отримує репутацію цінового лідера, впливаючи на стратегії конкурентів. Аналогічні моделі можна побачити на ринку лоукост-авіаперевезень, фінтеха або електронної комерції.
У всіх цих прикладах ми бачимо, як перша пропозиція (хід лідера) створює рамки для подальшого обговорення і часто має значний вплив на кінцевий результат. Це відображає ключовий принцип рівноваги за Штакельбергом: перевага першого ходу та здатність лідера впливати на дії послідовників.
Як це впливає на суспільство? По-перше, рівновага за Штакельбергом може призвести до більш ефективного створення суспільних благ. Уявіть, що уряд (лідер) анонсує масштабний проєкт з розвитку зеленої або розподільчої енергетики. Приватний сектор (послідовники) може тепер планувати свої інвестиції та інновації, знаючи напрямок державної політики. Це може прискорити перехід до сталої енергетики, створюючи суспільне благо у вигляді чистішого довкілля.
Крім того, рівновага за Штакельбергом може сприяти більш передбачуваному економічному середовищу. Коли центральний банк (лідер) успішно втілює та комунікує свою монетарну політику, бізнес та споживачі можуть краще впевнено формувати свої очікування та планувати свої фінансові рішення. Такі сталі очікування є частиною макрофінансової стабільності, і є суспільним благом самі по собі.
У сфері інновацій ця модель також може мати позитивний вплив. Компанія-лідер, яка першою виходить на ринок з новим продуктом, може встановити стандарти для всієї галузі. Це може стимулювати конкурентів до інвестицій у дослідження та розробки (R&D), що в кінцевому підсумку принесе користь споживачам та суспільству в цілому. Аналогічно трапляється, наприклад, коли Мінцифри пропонує ідею створення Дія-Сіті, встановлюючи нові правила гри для ІТ-сектору.
Однак рівновага за Штакельбергом не позбавлена недоліків. Вона може призвести до нерівномірного розподілу влади та ресурсів, де лідер отримує непропорційно велику вигоду. Часто вона посилює нерівність, коли сильніші діятимуть як лідери. Тому держава в своїй практиці повинна розуміти як переваги, так і складнощі моделі.
Вибір моделей для держави
Вибір між цими концепціями залежить від конкретної ситуації та цілей суспільства. У деяких випадках, наприклад, при розробці антимонопольної політики, може бути корисніше прагнути до рівноваги Неша для забезпечення чесної конкуренції. Податкова політика, де чесна сплата податків є оптимальною стратегією для всіх платників, також є одним із варіантів застосування рівноваги Неша. Так само при встановленні екологічних стандартів та норм, дотримання яких є вигідним для всіх підприємств.
В інших ситуаціях, таких як боротьба зі зміною клімату, Парето-оптимальне рішення може бути ідеальним, хоча й складним для досягнення. Парето-оптимальних рішень також варто шукати при розробці програм соціальної допомоги, які покращують становище вразливих груп без погіршення ситуації для інших, або при втіленні економічних реформ, які підвищують загальну ефективність економіки без створення "переможених".
Рівновага за Штакельбергом може бути особливо корисною в ситуаціях, де потрібне чітке лідерство та координація дій. Наприклад, при реагуванні на глобальні кризи, такі як пандемії, модель допомагала координувати міжнародні зусилля, де провідні країни або організації встановлювали напрямок, а інші країни слідували за ними. В екологічній політиці встановлення амбітних цілей щодо зменшення викидів на рівне держави спонукає бізнес адаптуватися та інвестувати у зелені технології.
Найефективніший підхід часто полягає у комбінуванні цих концепцій при аналізі політик, розробці стимулів для ринку або в міжнародних перемовинах. Розуміння динаміки лідерства (Штакельберг), прагнення до загальної ефективності (Парето) та врахування індивідуальних стимулів (Неш) може допомогти створити більш збалансовані та ефективні суспільні системи.
Прийняття рішень на рівні держави завжди є ризиковим з урахуванням складнощі процесів в суспільстві. Зрештою, застосування цих концепцій теорії ігор допомагає державі створювати більш ефективні, справедливі та стабільні системи регулювання, які враховують складні взаємодії між різними учасниками економіки та суспільства.
Ми впевнені, що в українських вишах, таких як КШЕ, УКУ, Могилянці та КПІ, є багато експертів, які можуть допомогти державі приймати кращі обмірковані стратегічні рішення. Суспільство тільки виграє від цього.
Владислав Рашкован, заступник Виконавчого директора МВФ
Олексій Ігнатенко, доктор фізико-математичних наук, професор УКУ