Головна > Грудничок > Оптимальний механізм знаходження рішення рівноваги. Типи рівноваги: рівновага по Нешу, Штекельбергу, Паретто-оптимальна рівновага, рівновага домінуючих стратегій

Оптимальний механізм знаходження рішення рівноваги. Типи рівноваги: рівновага по Нешу, Штекельбергу, Паретто-оптимальна рівновага, рівновага домінуючих стратегій

Поєднуючи в єдиному графіку лінії попиту та пропозиції, отримуємо графічне зображення рівноваги в координатах Р, Q(Рис. 2.6). Точка перетину ліній має координати (Р *, Q *),де р* -рівноважна ціна, Q *- рівноважний обсяг виробництва та споживання.

Ринкова рівновага- це такий стан ринку, у якому для цього рівня ціни обсяг попиту дорівнює обсягу пропозиції.

Лише у точці рівноваги Еринок збалансований, ні з ринкових агентів немає стимулів до зміни ситуації. Це означає, що ринкова рівновага має властивість стійкості -у разі виникнення нерівноважного стану ринкові агенти мотивовані повернення ринку на рівновагу. Для підтвердження стійкості зазвичай застосовують логіку Л. Вальраса чи А. Маршалла.

По Л. Вальрасу, за дуже високих цін виникає надлишок пропозиції - надвиробництво (відрізок А-Вна рис. 2.6я), такий ринок називається ринком покупця,оскільки покупець має можливість під час укладання угод вимагати зниження цін. У такій ситуації не зацікавлений насамперед продавець, який змушений знижувати ціни та скорочувати обсяги виробництва. У міру зниження цін обсяг попиту збільшується, відрізок А-Вскорочується, доки стає точкою рівноваги Є.

За низьких цін виникає надлишок попиту - дефіцит (відрізок CFna рис. 2.6а), складається ринок продавця.Покупець змушує-

ден скорочувати споживання і переплачувати за дефіцитний товар, за підвищенням ціни зростає обсяг пропозиції, дефіцит скорочується, доки ринок приходить у рівновагу.

По А. Маршалл (мал. 2.66), при малих обсягах виробництва ціна попиту перевищує ціну продавця, за більших обсягів - навпаки. У будь-якому випадку ситуація дисбалансу стимулює усунення ціни або обсягу попиту та пропозиції у бік рівноваги. Рівновість (а)по Вальрасу - ціна регулює дисбаланс обсягів попиту та пропозиції, (б)по Маршаллу - зміною обсягів врівноважуються ціни покупця та продавця.

Рис. 2.6. Встановлення ринкової рівноваги: в) за Л. Вальрас; б) за А. Маршаллом

Зміна ринкового попиту чи пропозиції призводить до зміни рівноваги (рис. 2.7). Якщо, наприклад, ринковий попит зростає, то лінія попиту зсувається праворуч, тоді рівноважна ціна та обсяг зростають. Якщо ринкова пропозиція зменшується, лінія пропозиції зсувається вліво, що призводить до збільшення ціни та скорочення обсягів.

Ця модель ринку є статичною, оскільки у ній не фігурує час.

«Павутиноподібна» модель

Як приклад динамічної моделі ринкової рівноваги наведемо найпростішу «павутиноподібну» модель. Припустимо, обсяг попиту залежить від рівня цін поточного періоду t,а обсяг пропозиції – від цін попереднього періоду t-1:

Q d i = Q d i (P t) , Q s i = Q s i (P t -1) ,

де t = 0,1 .... T-дискретне значення тимчасового періоду.

Рис. 2.7. Зміна ринкової рівноваги:

а) внаслідок збільшення попиту; б)внаслідок зменшення

пропозиції

Ринкова ціна P tможе не співпадати з рівноважною ціною р *,причому можливі три варіанти динаміки P t(Рис. 2.8).

Варіант траєкторії розвитку в цій моделі залежить від співвідношення нахилів ліній попиту та пропозиції.

Рис. 2.8. «Павутиноподібна» модель ринкової рівноваги:

а) відхилення від рівноваги зменшується; 5) відхилення

від рівноваги збільшується (модель "катастрофи"); в) ринок

циклічно коливається навколо точки рівноваги, але рівновага

Вивчимо механізм встановлення ринкової рівноваги, коли під впливом зміни чинників попиту чи пропозиції ринок виходить із цього стану. Існують два основні варіанти диспропорції між попитом та пропозицією: надлишок та дефіцит товару.

Надлишок(надлишок) товару – це така ситуація над ринком, коли величина пропозиції товару у цій ціні перевищує величину попиту нього. У разі між виробниками виникає конкуренція, боротьба за покупців. У виграші залишається той, хто пропонує вигідніші умови реалізації товару. Таким чином, ринок прагне повернутися в стан рівноваги.

Дефіциттовару – у разі величина попиту товар у цій ціні перевищує запропоноване кількість товару. У цій ситуації виникає змагання між покупцями за можливість придбати дефіцитний товар. Перемагає той, хто пропонує високу ціну за цей товар. Зросла ціна привертає щодо нього увагу виробників, які починають розширювати виробництво, збільшуючи цим пропозицію товару. В результаті система повертається у стан рівноваги.

Виходячи з усього вище сказаного, ми приходимо до висновку, що ціна реалізує функцію, що врівноважує, стимулюючи розширення виробництва і пропозиції товару при дефіциті і стримуючи пропозицію, позбавляючи ринок від надлишків.

Врівноважує роль ціни пробуде як через попит, і через пропозицію.

Виходитимемо з припущення того, що рівновага, яка встановилася на нашому ринку, була порушена - під впливом будь-яких факторів (наприклад, зростання доходів) відбулося збільшення попиту, в результаті його крива змістилася з D1в D2(Рис. 4.3 а), а пропозиція залишилася незмінною.

Якщо ціна даного товару не змінилася відразу ж після зміщення кривої попиту, то слідом за зростанням попиту виникне ситуація, коли за попередньою ціною Р1кількість товару, яке кожен з покупців тепер може придбати (QD)перевищує той обсяг, який можуть запропонувати при даній ціні виробники даного товару (QS). Величина попиту тепер перевищуватиме величину пропозиції даного товару, що означає виникнення дефіциту товаруу розмірі Df = QD - Qsна даному ринку.

Дефіцит товарів, як ми знаємо, призводить до конкуренції між покупцями за можливість придбання цього товару, що призводить до зростання ринкових цін. У зв'язку з законом пропозиції реакцією продавців підвищення ціни буде збільшення обсягу запропонованого товару. На графіці цього буде виражено пересуванням точки ринкової рівноваги Е1вздовж кривої пропозиції до її перетину з новою кривою попиту D2де і буде досягнуто нової рівноваги даного ринку Е2 зрівноважною кількістю товарів Q2та рівноважною ціною Р2.

Рис. 4.3. Усунення точки рівноважної ціни.

Вивчимо ситуацію, коли рівноважний стан буде порушено з боку речення.

Виходитимемо з припущення того, що під впливом якихось факторів відбулося збільшення пропозиції, в результаті його крива змістилася вправо з положення S1в S2а попит залишився незмінним (рис. 4.3 б).

За умови збереження ринкової ціни на колишньому рівні (Р1)зростання пропозиції призведе до надлишкутовару у розмірі Sp = Qs - QD.В результаті виникає конкуренція продавців,що призводить до зниження ринкової ціни (з Р1до Р2)і зростання обсягу товару, що продається. На графіці цього буде відображено переміщенням точки ринкової рівноваги Е1вздовж кривої попиту до її перетину з новою кривою пропозиції, що призведе до встановлення нової рівноваги Е2з параметрами Q2і Р2.

Аналогічно можна виявити вплив на рівноважну ціну та рівноважну кількість товарів зменшення попиту та зменшення пропозиції.

У навчальній літературі сформульовано чотири правила взаємодії попиту та пропозиції.

Збільшення попиту викликає зростання рівноважної ціни та рівноважної кількості товарів.

Зменшення попиту викликає падіння і рівноважної ціни та рівноважної кількості товарів.

Збільшення пропозиції тягне за собою зменшення рівноважної ціни та збільшення рівноважної кількості товарів.

Скорочення пропозиції тягне за собою збільшення рівноважної ціни та зменшення рівноважної кількості товарів.

Варто сказати - користуючись цими правилами, можна знайти рівноважну точку за будь-яких змін попиту та пропозиції.

Поверненню ціни до ринкового рівноважного рівня в основному можуть перешкоджати такі обставини:

адміністративне регулювання цін;

монополізмвиробника або споживача, що дозволяє утримувати монопольну ціну, яка може бути як штучно завищеною, так і заниженою.

Оптимальними стратегіями теорії конфліктів вважаються такі стратегії, які призводять гравців до стійким рівновагам, тобто. деяким ситуаціям, які задовольняють всіх гравців.

Оптимальність вирішення теорії ігор заснована на понятті рівноважної ситуації:

1) жодному з гравців не вигідно відхилятися від рівноважної ситуації, якщо всі інші залишаються у ній,

2) сенс рівноваги – при багаторазовому повторенні гри, гравці вийдуть на ситуацію рівноваги, розпочавши гру у будь-якій стратегічній ситуації.

У кожному взаємодії можуть бути такі види рівноваг:

1. рівновага в обережних стратегіях . Визначається стратегіями, які забезпечують гравцям гарантований результат;

2. рівновага у домінуючих стратегіях .

Домінуючою стратегієюназивається такий план дій, який забезпечує учаснику максимальний виграш незалежно від дій іншого. Тому рівновагою домінуючих стратегій буде перетин домінуючих стратегій обох учасників гри.

Якщо оптимальні стратегії гравців домінують над усіма іншими стратегіями, то гра має рівновагу в домінуючих стратегіях. У грі "дилема ув'язнених" рівноважним за Нешем набором стратегій буде ("визнавати - визнавати"). Причому важливо відзначити, що як для гравця А, так і для гравця Б "визнавати" є домінуючою стратегією, тоді як "не визнавати" – домінованою;

3. рівновага Неша . Рівновагою Нешаназивається тип рішень гри двох і більше гравців, у якому жоден учасник неспроможна збільшити виграш, змінивши своє рішення у односторонньому порядку, коли інші учасники не змінюють рішення.

Допустимо, - гра nосіб у нормальній формі, де – набір чистих стратегій, а – набір виграшів.

Коли кожен гравець вибирає стратегію у профілі стратегій, гравець отримує виграш. Причому виграш залежить від усього профілю стратегій: не лише від стратегії, обраної самим гравцем, а й від чужих стратегій. Профіль стратегій є рівновагою по Нешу, якщо зміна своєї стратегії не вигідна жодному гравцю, тобто для будь-якого

Гра може мати рівновагу Неша і в чистих стратегіях, і змішаних.

Неш довів, що якщо дозволити змішані стратегіїтоді в кожній грі nгравців буде хоча б одна рівновага Неша.

У ситуації, рівноважній Нешу, стратегія кожного гравця забезпечує йому найкращий відгук на стратегії інших гравців;

4. Рівнавага Штакельберга. Модель Штакельберга- Теоретико-ігрова модель олігополістичного ринку за наявності інформаційної асиметрії. У цій моделі поведінка фірм описується динамічною грою з повною досконалою інформацією, в якій поведінка фірм моделюється за допомогою статичноїігри з повною інформацією. Головною особливістю гри є наявність лідируючої фірми, яка першою встановлює обсяг випуску товарів, інші фірми орієнтуються у своїх розрахунках неї. Основні передумови гри:

· Галузь виробляє однорідний товар: відмінності продукції різних фірм зневажливо малі, отже, покупець під час виборів, яка фірми купувати, орієнтується лише ціну;

· У галузі діє невелика кількість фірм;

· Фірми встановлюють кількість виробленої продукції, а ціна на неї визначається виходячи з попиту;

· Існує так звана фірма-лідер, на обсяг виробництва якої орієнтуються інші фірми.

Таким чином, модель Штакельберга використовується для знаходження оптимального рішення в динамічних іграх і відповідає максимальному виграшу гравців, виходячи з умов, що склалися після вибору одного або кількома гравцями. Рівноваги по Штакельбергу.- ситуація, коли жоден з гравців не може збільшити свій виграш в односторонньому порядку, а рішення приймаються спочатку одним гравцем та стають відомими другому гравцю. У грі «дилема ув'язнених» рівновага за Штакельбергом буде досягнуто в квадраті (1; 1) – "визнавати вину" обома злочинцями;

5. оптимальність за Парето- такий стан системи, у якому значення кожного приватного критерію, описує стан системи, може бути поліпшено без погіршення становища інших гравців.

Принцип Парето говорить так: «Будь-яка зміна, яка не приносить збитків, а яка деяким людям приносить користь (за їхньою власною оцінкою), є поліпшенням». Таким чином, визнається право на всі зміни, які не завдають нікому додаткової шкоди.

Багато станів системи, оптимальних по Парето, називають «множиною Парето», «множиною альтернатив, оптимальних у сенсі Парето», або «множиною оптимальних альтернатив».

Ситуація, коли досягнуто ефективності за Парето - це ситуація, коли всі вигоди від обміну вичерпані.

Ефективність за Парето одна із центральних понять для сучасної економічної науки. На основі цього поняття будуються перша та друга фундаментальні теореми добробуту.

Однією з додатків Парето-оптимальності є Парето-распределение ресурсів (трудових ресурсів і капіталу) за міжнародної економічної інтеграції, тобто. економічному об'єднанні двох і більше країн. Цікаво, що Парето-розподіл до та після міжнародної економічної інтеграції було адекватно математично описано (Далімов Р.Т., 2008). Аналіз показав, що додана вартість секторів та доходи трудових ресурсів рухаються протиспрямовано відповідно до добре відомого рівняння теплопровідності аналогічно газу або рідини у просторі, що дає можливість застосувати методику аналізу, що використовується у фізиці, щодо економічних завдань з міграції економічних параметрів.

Оптимум за Паретокаже, що добробут суспільства досягає максимуму, а розподіл ресурсів стає оптимальним, якщо будь-яка зміна цього розподілу погіршує добробут хоча б одного суб'єкта економічної системи.

Парето-оптимальний стан ринку- Ситуація, коли не можна поліпшити становище будь-якого учасника економічного процесу, одночасно не знижуючи добробуту як мінімум одного з інших.

Згідно з критерієм Парето (критерієм зростання суспільного добробуту), рух у бік оптимуму можливий лише за такого розподілу ресурсів, який збільшує добробут принаймні однієї людини, не завдаючи шкоди нікому іншому.

Говорять, що ситуація S* домінує за Парето ситуацію S, якщо:

· для будь-якого гравця його виграш у S<=S*

· є хоча б один гравець, для якого його виграш у ситуації S*>S

У задачі " дилема ув'язнених " рівновагу по Парето, коли поліпшити становище жодного з гравців, не погіршуючи у своїй становище іншого, не можна, відповідає ситуація квадрата (2;2).

Розглянемо приклад 1.

Розглянемо механізм встановлення ринкової рівноваги, коли під впливом зміни факторів попиту чи пропозиції ринок виходить із цього стану. Існують два основні варіанти диспропорції між попитом та пропозицією: надлишок та дефіцит товару.

Надлишок(надлишок) товару - це така ситуація на ринку, коли величина пропозиції товару за цією ціною перевищує величину попиту на нього. І тут між виробниками виникає конкуренція, боротьба покупців. У виграші залишається той, хто пропонує вигідніші умови реалізації товару. Таким чином, ринок прагне повернутися в стан рівноваги.

Дефіциттовару – у разі величина попиту товар за даною ціною перевищує запропоновану кількість товару. У цій ситуації виникає змагання між покупцями за можливість придбати дефіцитний товар. Перемагає той, хто пропонує високу ціну за цей товар. Зросла ціна привертає до нього увагу виробників, які починають розширювати виробництво, збільшуючи цим пропозицію товару. В результаті система повертається у стан рівноваги.

Таким чином, ціна виконує врівноважуючу функцію, стимулюючи розширення виробництва та пропозиції товару при дефіциті та стримуючи пропозицію, позбавляючи ринок від надлишків.

Врівноважує роль ціни проявляється як через попит, і через пропозицію.

Припустимо, що рівновага, яка встановилася на нашому ринку, була порушена - під впливом будь-яких факторів (наприклад, зростання доходів) відбулося збільшення попиту, в результаті його крива змістилася з D1в D2(Рис. 4.3 а), а пропозиція залишилася незмінною.

Якщо ціна даного товару не змінилася відразу ж після зміщення кривої попиту, то за зростанням попиту виникне ситуація, коли за попередньою ціною Р1кількість товару, яке кожен із покупців тепер може придбати (QD)перевищує той обсяг, який можуть запропонувати за даної ціни виробники даного товару (QS).Величина попиту тепер перевищуватиме величину пропозиції даного товару, що означає виникнення дефіциту товаруу розмірі Df = QD - Qsна даному ринку.

Дефіцит товарів, як ми знаємо, призводить до конкуренції між покупцями за можливість придбання цього товару, що призводить до зростання ринкових цін. Відповідно до закону пропозиції реакцією продавців на підвищення ціни буде збільшення обсягу запропонованого товару. На графіку це буде виражено пересуванням точки ринкової рівноваги Е1вздовж кривої пропозиції до її перетину з новою кривою попиту D2де і буде досягнуто нової рівноваги даного ринку Е2 зрівноважною кількістю товарів Q2та рівноважною ціною Р2.

Рис. 4.3. Усунення точки рівноважної ціни.

Розглянемо ситуацію, коли рівноважний стан буде порушено із боку пропозиції.

Припустимо, що під впливом якихось факторів відбулося збільшення пропозиції, в результаті його крива змістилася праворуч із положення S1в S2а попит залишився незмінним (рис. 4.3 б).

За умови збереження ринкової ціни на колишньому рівні (Р1)зростання пропозиції призведе до надлишкутовару у розмірі Sp = Qs - QD.В результаті виникає конкуренція продавців,що призводить до зниження ринкової ціни (з Р1до Р2)і зростання обсягу товару, що продається. На графіку це буде відображено переміщенням точки ринкової рівноваги Е1вздовж кривої попиту до її перетину з новою кривою пропозиції, що призведе до встановлення нової рівноваги Е2з параметрами Q2і Р2.

У навчальній літературі сформульовано чотири правила взаємодії попиту та пропозиції.

1. Збільшення попиту викликає зростання рівноважної ціни та рівноважної кількості товарів.

2. Зменшення попиту викликає падіння і рівноважної ціни та рівноважної кількості товарів.

3. Збільшення пропозиції тягне за собою зменшення рівноважної ціни та збільшення рівноважної кількості товарів.

4. Скорочення пропозиції тягне за собою збільшення рівноважної ціни та зменшення рівноважної кількості товарів.

Користуючись цими правилами, можна знайти рівноважну точку за будь-яких змін попиту та пропозиції.

Поверненню ціни до ринкового рівноважного рівня в основному можуть перешкоджати такі обставини:

1) адміністративне регулювання цін

2) монополізмвиробника або споживача, що дозволяє утримувати монопольну ціну, яка може бути штучно завищеною, так і заниженою.

| |

В антагоністичній грі природно вважати оптимальним такий результат, при якому жодному гравцю невигідно від нього відхилятися. Подібний результат (x *, y *) називається ситуацією рівноваги, а принцип оптимальності, заснований на пошуку ситуації рівноваги, - принципом рівноваги.

Визначення. У матричній грі з матрицею розмірності результат є ситуацією рівновагиабо сідловою точкою, якщо

У сідловій точці елемент матриці є одночасно мінімумом у своєму рядку та максимумом у своєму стовпці. У грі з прикладу 2 елемент a 33є сідловою точкою. Оптимальними у цій грі є треті стратегії для обох гравців. Якщо перший гравець відхиляється від третьої стратегії, він починає вигравати менше, ніж a 33. Якщо другий гравець відхиляється від третьої стратегії, він починає програвати більше, ніж a 33. Таким чином, для обох гравців немає нічого кращого, ніж послідовно дотримуватись третьої стратегії.

Принцип оптимальної поведінки: якщо в матричній грі є сідлова точка, то оптимальним є вибір стратегії, що відповідає сідловій точці. Що буде, якщо в грі виявиться більше однієї сідлової точки?

Теорема. Нехай дві довільні сідлові крапки у матричній грі. Тоді:

Доказ. З визначення ситуації рівноваги маємо:

Підставимо в ліву частину нерівності (2.8) , а праву - , ліву частина нерівності (2.9) - , праву - . Тоді отримаємо:

Звідки випливає рівність:

З теореми випливає, що функція виграшу набуває одного і того ж значення у всіх ситуаціях рівноваги. Саме тому число називається ціною гри. А стратегії, що відповідають будь-якій з сідлових точок, називаються оптимальними стратегіямигравців 1 та 2, відповідно. З огляду на (2.7) всі оптимальні стратегії гравця взаємозамінні.

Оптимальність поведінки гравців не зміниться, якщо у грі безлічі стратегій залишаються незмінними, а функція виграшу множиться на позитивну константу (або до неї додається постійна кількість).

Теорема. Для існування в матричній грі сідлової точки (i *, j *) необхідно і достатньо, щоб максимін дорівнював мінімакс:

(2.10)

Доказ. Необхідність.Якщо (i*,j*) – сідлова точка, то згідно (2.6) :

(2.11)

Водночас маємо:

(2.12)

З (2.11) та (2.12) отримуємо:

(2.13)

Розмірковуючи аналогічно, приходимо до рівності:

Таким чином,

З іншого боку, завжди виконується зворотна нерівність (2.5), тому справедливим виявляється (2.10).

Достатність. Нехай справедливо (2.10). Доведемо наявність сідлової точки. Маємо:

Відповідно до рівності (2.10), нерівності (2.15) та (2.16) перетворюються на рівності. Після чого маємо:

Теорему доведено. Принагідно доведено, що загальне значення максиміна і мінімаксу дорівнює ціні гри.

Змішане розширення гри

Розглянемо матричну гру G. Якщо існує ситуація рівноваги, то мінімакс дорівнює максимину. Причому кожен із гравців може повідомити іншого гравця інформацію про свою оптимальну стратегію. Його суперник не зможе отримати з цієї інформації жодної додаткової вигоди. Тепер припустимо, що у грі G немає ситуації рівноваги. Тоді:

У цьому випадку мінімаксна та максимінна стратегії не є стійкими. Гравці можуть мати стимули до відхилення від своїх обережних стратегій, пов'язані з можливістю отримання більшого виграшу, але й ризиком програшу, тобто отримання виграшу меншого, ніж при застосуванні обережної стратегії. При застосуванні ризикованих стратегій передача інформації про них противнику має згубні наслідки: гравець автоматично отримує менший виграш, ніж при застосуванні обережної стратегії.

Приклад 3. Нехай матриця гри має вигляд:

Для такої матриці, тобто. ситуації рівноваги немає. Обережними стратегіями гравців є i * = 1, j * = 2. Нехай гравець 2 дотримується стратегії j*=2, а гравець 1 вибере стратегію i=2. тоді останній отримає виграш 3, що у дві одиниці більше, ніж максимин. Якщо, однак, гравець 2 здогадається про плани гравця 1, він змінить свою стратегію на j=1, і тоді перший отримає виграш 0, тобто менше максиміна. Аналогічні міркування можна провести і другого гравця. Загалом можна дійти невтішного висновку, що застосування авантюрної стратегії може у окремої партії гри принести результат більший, ніж гарантований, та її застосування пов'язані з ризиком. Виникає питання, чи не можна скомбінувати надійну обережну стратегію з авантюрною в такий спосіб, щоб збільшити свій середній виграш? По суті, питання стоїть про те, як поділити між гравцями виграш (2.17)?

Виявляється, розумним рішенням є застосування змішаної стратегії, тобто випадковий вибір чистих стратегій. Нагадаємо, що стратегія гравця 1 називається змішаною, якщо вибір i-ого рядка проводиться ним з деякою ймовірністю p i .Таку стратегію можна ототожнити з розподілом ймовірностей на безлічі рядків. Припустимо, перший гравець має m чистих стратегій, а другий – n чистих стратегій. Тоді їх змішані стратегії – це імовірнісні вектори:

(2.18)

Розглянемо дві можливі змішані стратегії першого гравця з прикладу 3: . Ці стратегії відрізняються розподілом ймовірностей між чистими стратегіями. Якщо у першому випадку рядки матриці вибираються гравцем із рівними ймовірностями, то у другому випадку – з різними. Коли ми говоримо про змішану стратегію, то маємо на увазі під випадковим вибором не вибір «навмання», а вибір, заснований на роботі випадкового механізму, що забезпечує потрібний нам розподіл ймовірностей. Так для реалізації першої із змішаних стратегій добре підходить підкидання монетки. Гравець обирає перший рядок або другий залежно від того, як випаде монетка. У середньому гравець однаково часто вибиратиме як перший рядок, так і другий, проте вибір на конкретній ітерації гри не підпорядкований жодному фіксованому правилу і має максимальний рівень скритності: до реалізації випадкового механізму він невідомий навіть самому першому гравцю. Для реалізації другої змішаної стратегії добре підходить механізм жеребкування. Гравець бере сім однакових папірців, помітивши три з них хрестиком, і кидає в шапку. Потім, навмання, витягує одну з них. Відповідно до класичної теорії ймовірностей він витягне папірець з хрестиком з ймовірністю 3/7, а чистий папірець – з ймовірністю 4/7. Подібний механізм жеребкування здатний реалізовувати будь-які раціональні можливості.

Нехай гравці дотримуються змішаних стратегій (2.18). Тоді виграш першого гравця на окремо взятій ітерації гри є випадковою величиною: v(X,Y). Оскільки гравці вибирають стратегії незалежно одна від одної, то, згідно з теоремою множення ймовірностей, ймовірність вибору результату (i,j) з виграшем дорівнює добутку ймовірностей. Тоді закон розподілу випадкової величини v(X,Y)заданий наступною таблицею

Нехай тепер гра розігрується нескінченно довго. Тоді середній виграш у такій грі дорівнює математичному очікуванню величини v(X,Y).

(2.19)

При кінцевому, але досить великому числі ітерацій гри середній виграш трохи відрізнятиметься від величини (2.19).

Приклад 4. Розрахуємо середній виграш (2.19) для гри з прикладу 3 під час використання гравцями наступних стратегій: . Матриця виграшів і матриця ймовірностей виглядають так:

Знайдемо середнє:

Таким чином, середній виграш (2.20) має проміжне значення між максиміном та мінімаксом.

Оскільки будь-якої пари змішаних стратегій X і Y можна підрахувати середнє значення гри, виникає завдання пошуку оптимальної стратегії. Природно розпочати із дослідження обережних стратегій. Обережна стратегія першого гравця забезпечує йому максимін. Обережна стратегія другого гравця не дозволяє першому виграти більше, ніж мінімаксу. Найзначнішим результатом теорії ігор з протилежними інтересами вважатимуться наступний:

Теорема. Будь-яка матрична гра має ситуацію рівноваги у змішаних стратегіях. Доказ цієї теореми непросто. У цьому курсі воно опускається.

Наслідки: Існування ситуації рівноваги означає, що максимін дорівнює мінімакс, і, отже, будь-яка матрична гра має ціну. Оптимальною стратегією першого гравця є максимальна стратегія. Оптимальною стратегією другого – мінімаксна. Оскільки завдання пошуку оптимальних стратегій вирішено, то кажуть, що будь-яка матрична гра можна розв'язатина безлічі змішаних стратегій.

Вирішення гри 2х2

Приклад 5. Вирішити гру. Не важко переконатися, що сідлової точки немає. Позначимо оптимальну стратегію першого гравця (х, 1-х)– це вектор стовпець, але для зручності записуємо його у вигляді рядка. Оптимальну стратегію другого гравця позначимо (y,1-y).

Виграш першого гравця є випадковою величиною з наступним розподілом:

v(x,y)	2	-1	-4	7
p	xy	x(1-y)	(1-x)y	(1-x)(1-y)

Знаходимо середній виграш за ітерацію першого гравця – математичне очікування випадкової величини v(x,y):

Перетворимо цей вираз:

Дане математичне очікування складається з константи (5/7) та змінної частини: 14(x-11/14)(y-8/14). Якщо значення yвідрізняється від 8/14, то перший гравець завжди може вибрати хтаким чином, щоб зробити змінну частину позитивною, збільшуючи власний виграш. Якщо значення хвідрізняється від 11/14, то другий гравець завжди може вибрати yтаким чином, щоб зробити змінну частину негативною, зменшуючи виграш першого гравця. Таким чином, сідлова точка визначається рівностями: x * = 11/14, y * = 8/14.

2.5 Вирішення ігор

Спосіб вирішення подібних ігор покажемо на прикладі.

Приклад 6. Вирішити гру . Переконуємося, що сідлової точки немає. Позначимо змішану стратегію першого гравця X=(х, 1-х)– це вектор стовпець, але для зручності записуємо його у вигляді рядка.

Нехай перший гравець застосовує стратегію Х, а другий - свою чисту j-ю стратегію. Позначимо середній виграш першого гравця у цій ситуації як. Маємо:

Зобразимо графіки функцій (2.21) на відрізку.

Ордината точки, що знаходиться на будь-якому відрізку прямих, відповідає виграшу першого гравця в ситуації, коли він застосовує змішану стратегію (х, (1-х))а другий гравець – відповідну чисту стратегію. Гарантований результат першого гравця - це нижня загальна родина прямих (ламана АВС). Найвища точка цієї ламаної (точка В) є максимальним гарантованим результатом гравця 1. Абсцисса точки відповідає оптимальної стратегії першого гравця.

Оскільки шукана точка є перетином ліній і , то її абсцисса може бути знайдена як рішення рівняння:

Отже, оптимальна змішана стратегія першого гравця – (5/9, 4/9). Ордината точки є ціною гри. Вона дорівнює:

(2.22)

Зауважимо, що лінія, що відповідає другій стратегії другого гравця, проходить вище точки В. Це означає, що якщо перший гравець застосовує свою оптимальну стратегію, а гравець 2 – другу, то програш другого збільшується порівняно із застосуванням стратегій 1 або 3. Таким чином, друга стратегія має брати участь у оптимальної стратегії другого гравця. Оптимальна стратегія гравця 2 повинна мати вигляд: . Чисті стратегії 1 і 3 другого гравця, що мають в оптимальній стратегії ненульові складові, прийнято називати суттєвими. Стратегія 2 називається несуттєвою. З малюнка вище, і навіть з рівності (2.22) видно, що з застосуванні першим гравцем своєї оптимальної стратегії виграш другого гравця залежить від цього, яку зі своїх істотних стратегій він застосовує. Він може застосувати також будь-яку змішану стратегію, що складається з істотних (зокрема оптимальну), виграш і в цьому випадку не зміниться. Абсолютно аналогічне твердження є справедливим і для протилежного випадку. Якщо другий гравець застосовує свою оптимальну стратегію, то виграш першого гравця не залежить від того, яку зі своїх суттєвих стратегій він застосовує та дорівнює ціні гри. Використовуючи це твердження, знайдемо оптимальну стратегію другого гравця.

Статті потемі:

Асоціація Саморегульована організація «Брянське Регіональне Об'єднання Проектувальників Зміни у ФЗ 340 від 03

Минулого тижня ми за допомогою нашого пітерського експерта про новий Федеральний закон № 340-ФЗ від 3 серпня 2018 року "Про внесення змін до Містобудівного кодексу Російської Федерації та окремі законодавчі акти Російської Федерації". Акцент був з

Хто розраховує заборгованість із аліментів?

Аліментна заборгованість - це сума, що утворюється внаслідок відсутності грошових виплат за аліментами з боку зобов'язаної особи або часткових виплат за певний період. Цей період часу може тривати максимально: До настання

Довідка про доходи, витрати, про майно державного службовця

Довідка про доходи, витрати, про майно та зобов'язання майнового характеру – це документ, який заповнюється та подається особами, які претендують або заміщають посади, здійснення повноважень за якими передбачає безумовний обов'язок

Поняття та види нормативних правових актів

Нормативно-правові акти – це корпус документів, який регулює правовідносини у всіх сферах діяльності. Це система джерел права. До неї входять кодекси, закони, розпорядження федеральних та місцевих органів влади і т. д. Залежно від виду

Популярне

2022-03-23 03:40:43	Біографія Євгена Алдоніна: нова сім'я Виступ за цска
2022-03-23 03:40:43	Нове у формуванні та веденні кадрового резерву на державній цивільній службі
2022-03-23 03:40:43	Скільки заробляють судові пристави?
2022-03-23 03:40:43	Теорія Дж. М. Кейнс. Біографія Дж. Кейнса На кому був одружений кейнс
2022-03-17 00:25:56	Історія та сучасність валюти Франції
2022-03-17 00:25:56	Хімічний склад та харчова цінність
2022-03-17 00:25:56	Гра мафія у контакті досягнення
2022-03-17 00:25:56	Варолієв міст - основний взаємозв'язок між відділами мозку Поперечний зріз моста
2022-03-17 00:25:56	Модель загальної рівноваги Вальраса
2022-03-17 00:25:56	Районування Сутність та рівні економічного районування

Нове

2022-03-17 00:25:56	Страхування від нещасного випадку та хвороб Страхування від нещасного випадку на один день
2022-03-17 00:25:56	Класифікація та асортимент сирів
2022-03-11 18:04:07	Чи можна митися у Водохреще?
2022-03-11 18:04:07	Чи можна митися у Водохреще?
2022-03-11 18:04:07	Найаномальніші дороги світу Аномальне місце на трасі
2022-03-11 18:04:07	Що говориться в Біблії про кінець світу?
11.03.2022	Ви тут: «Дезінфектор» та «Медичний дезінфектор»: у чому подібність та відмінність?
11.03.2022	Список грізних птахів, найнебезпечніших для людини Напад хижих птахів на людину
11.03.2022	Три містичні таємниці із розсекречених архівів кгб Журнал секретні архіви читати онлайн
11.03.2022	Чому геостаціонарні супутники не падають на землю?
06.03.2022	З скільки продають алкоголь у різних країнах?
06.03.2022	З скільки продають алкоголь у різних країнах?