Дилемма заключенного + Теория игр

Теги

С этим тегом используют:

Все теги

Рейтинг

Автор

Сообщество

Тип постов

любые текстовые картинка видео [мое] NSFW

Период времени

за все время неделя месяц интервал

13 постов сначала свежее

Eriright

1 год назад

Серия Теория игр для начинающих

Повторяющаяся дилемма заключённого⁠⁠

В книге «Эволюция кооперации» (1984) Роберт Аксельрод исследовал поведение игроков в повторяющейся дилемме заключенного. Он предложил своим коллегам реализовать алгоритмы, реализующие данную игру и провёл турнир среди данных алгоритмов. В турнире приняло участие много программ, реализующих алгоритмы. Интересно, что по поведению программ можно было наделять их человеческими качествами. Например, оказалось, что «жадные» программы начинали терпеть поражение после нескольких игр, то есть, в долгосрочной перспективе они оказывались несостоятельными. «Альтруистические» программы, стремящиеся к кооперации приводили, опять таки, в долгосрочной перспективе, к положительным результатам в плане выигрыша. Аксельрод показал, что возможен естественный отбор, приводящий к альтруистическому поведению при начальном эгоистичном поведении.

Среди представленных программ были как очень сложные, так и очень простые, как детерминистические (не зависящие от случайных чисел), так и не детерминистические (смешанные). Интересно, что наилучшей из детерминистических стратегий оказалась стратегия «око за око», которая состояла всего из четырёх строк на бейсике. Она всегда сотрудничала на первом шаге, а на следующих шагах она повторяла поведение соперника, то есть, «предавала», если предавал соперник, и «сотрудничала», если сотрудничал соперник. Если добавить к этой стратегии элемент случайности, например, чтобы в случае предательства программа иногда, с вероятностью 1-5%, прощала, то результат мог бы оказаться ещё лучше. Это помогало разрушить цикл взаимного предательства (интересно звучит).

Анализируя результаты турнира, Аксельрод выделил несколько условий, способствующих высоким результатам в игре.

Стратегия не должна предавать до тех пор, пока ее не предаст противник. Почти каждая стратегия в верхней части турнирной таблицы обладала данным свойством, назовем его добротой. Интересно, что для получения наибольшей выгоды для себя, то есть из чисто корыстных побуждений, стратегия не должна предавать противника первой.
Стратегия должна реагировать на попытку противника предать ее. Стратегия всепрощения обречена на провал, потому что всегда найдется «подлая» стратегия, которая непременно воспользуется такой наивностью. Другими словами, успешная стратегия должна быть мстительной.
Если противник перестанет предавать, хорошей стратегией будет возобновление сотрудничества. Стратегия должна быть мягкой. Стратегия должна уметь прощать.
Зависть – желание набрать очков больше, чем соперник. Это – плохое свойство, хорошие стратегии независтливы.

Вывод из этого эксперимента звучит странно: для того, чтобы стратегии-эгоисты получали как можно больше выгоды для себя, они должны быть добрыми, независтливыми и прощающими. Неожиданно, не так ли?

Игра в монетки

Давайте проанализируем следующую игру.

Имеется два игрока. Один из них прячет монету в руке. Другой пытается угадать, где монета. Игрок, угадавший, в какой руке монета у партнёра, забирает её. Если угадать не получилось, мы отдаём партнёру по игре свою монетку.

Построим матрицу платежей для данной игры.

Повторяющаяся дилемма заключённого Математика, Книги, Задача, Логика, Популяризация, Теория игр, Научпоп, Дилемма заключенного

Как мы видим, в данной игре ВООБЩЕ нет никаких равновесий – ни по Нэшу, ни Парето-оптимальных.

Как вы думаете, какое будет равновесие в смешанных стратегиях в данной игре?

Вы можете попробовать поиграть в данную игру со своими друзьями, чтобы попробовать найти вашу лучшую стратегию.

Показать полностью 2

[моё] Математика Книги Задача Логика Популяризация Теория игр Научпоп Дилемма заключенного

Eriright

1 год назад

Серия Теория игр для начинающих

Парадокс Сена⁠⁠

Всем привет! Я продолжаю свою серию постов по популяризации науки :) Пока я выкладываю материалы по теории игр.

Штрафы за отклонение от стратегий

Парадокс Сена Математика, Книги, Теория игр, Дилемма заключенного, Популяризация, Парадокс, Длиннопост

Введя штрафы за какие-то поступки, можно достаточно сильно поменять матрицу платежей.

Пусть Франкенштейн и Дракула заключили предварительно такой договор: в случае, если кто-то один из них попытается заложить другого, друзья того, кого он заложил, поймают и посадят его в подвал на 3 года. Посмотрим, как изменится матрица платежей в данном случае.

Ну что же, очевидно, что теперь уже взаимное молчание является равновесием. Так что да, такой механизм вполне работает.

Парадокс Сена

Я закончу первоначальное знакомство с теорией игр и концепцией равновесий по Нэшу и Парето-оптимальности еще одним парадоксом, связанным с концепцией оптимума в смысле Парето.

Либеральный парадокс, также называемый парадоксом Сена, представляет собой логический парадокс, предложенный Амартия Сеном в статье 1970 года. Он показывает, что ни одна социальная система не может одновременно быть привязанной к минимуму свободы, и приводить к эффективности по Парето.

Этот парадокс спорен, потому что он, кажется противоречащим классическому либеральному утверждению, что рынки одновременно эффективны и уважают личные свободы.

В исходном примере Сена использовалось простое общество, в котором было всего два человека и одна социальная проблема для рассмотрения. Назовем этих двух членов общества «Гарри Гудини» и «Дэвид Копперфильд». В этом обществе существует только одна копия «Теории игр». Эту книгу можно дать прочитать либо Дэвиду Копперфильду (решение А), либо Гарри Гудини (В), либо никому (С).

Предположим, что Гарри Гудини нравится такое чтение, и он предпочитает читать само произведение, а не избавляться от него (B>C). Однако еще большее удовольствие он получил бы от того, что Дэвид Копперфильд должен был прочитать эту книгу и немного поумнел (A>B>C).

Дэвид Копперфильд считает, что книга неприлична и ее вообще не следовало издавать, т.е. её вообще не стоит читать (он предпочитает, прежде всего, решение C). Однако, если кто-то должен это прочитать, Дэвид Копперфильд предпочел бы, чтобы это всё-таки сделал он, а не Гарри Гудини (A>B). Итак, для Дэвида Копперфилда C>A>B.

Учитывая предпочтения двух индивидуумов в обществе, специалист по социальному планированию должен решить, что делать. Должен ли планировщик заставлять Гарри Гудини читать книгу (A), заставлять Дэвида Копперфилда (B) читать её или оставить её непрочитанной (C)? Точнее, должен ли он ранжировать три возможных исхода в соответствии с их социальной желательностью?

Либеральный социальный планировщик решает, что он должен отстаивать права личности, каждый человек должен иметь возможность самостоятельно прочитать книгу.

Гарри Гудини должен иметь возможность решить, будет ли результат «Гарри Гудини читает» (B) иметь более высокий рейтинг, чем «Никто не читает» (C). Точно так же Дэвид Копперфильд также должен иметь возможность решить, будет ли результат «Дэвид Копперфильд читает» (A) выше, чем «Никто не читает» (C).

Следуя этой стратегии, социальный планировщик объявляет, что результат «Гарри Гудини читает» будет иметь более высокий рейтинг, чем «Никто не читает» (из-за предпочтений Гарри Гудини: B>C), и что «Никто не читает» будет иметь более высокий рейтинг, чем «Дэвид Копперфилд читает» (из-за предпочтений Дэвида Копперфилда в C>A). Затем согласованность требует, чтобы «Гарри Гудини читает» был выше, чем «Дэвид Копперфильд читает», и поэтому социальный планировщик дает Гарри Гудини книгу для чтения по принципу транзитивности B>C>A.

Но этот результат либерального планировщика, отдающего предпочтение индивидуальному выбору, и Дэвид Копперфильд, и Гарри Гудини считают хуже, чем «Дэвид Копперфильд читает» (А).

Действительно, Дэвид Копперфильд предпочитает читать плохую книгу вместо Гарри Гудини (A>B для Дэвида Копперфильда), а Гарри Гудини считает, что книга настолько хороша, что Дэвид Копперфильд обязательно должен ее прочитать (A>B также для Гарри Гудини).

Таким образом, результат, выбранный либеральным планировщиком, хуже по Парето. Есть еще один результат, который выше по Парето: тот, где Дэвид Копперфильд вынужден читать книгу.

Показать полностью 4

[моё] Математика Книги Теория игр Дилемма заключенного Популяризация Парадокс Длиннопост

Eriright

1 год назад

Серия Теория игр для начинающих

Парето-оптимальность⁠⁠

Парето-оптимальность

Из двух возможных видов игр мы до сих пор рассматривали только некооперативные, то есть те, в которых каждый игрок является эгоистом и желает максимизировать только свой собственный выигрыш или минимизировать свой проигрыш. Возникает вопрос: почему, например, в дилемме заключённого игроки не могут договориться между собой о том, какие стратегии применять?

Критики игрового анализа дилеммы заключённого считают, что рациональное поведение, приводящее к более выгодным для всех ситуациям, возникает не для отдельных лиц, а для групп. Поэтому они считают, что для отдельно взятого игрока его оптимальная стратегия будет заключаться в достижении оптимальной цели для всей группы в целом. Теория рабочего класса Карла Маркса является проявлением такого мышления.

Вильфредо Парето (1848–1923), итальянский социолог и экономист, внес свой вклад в изучение распределения доходов и анализ индивидуального выбора. Он вводит понятие эффективности и помогает развивать область микроэкономики с помощью таких идей, как кривая безразличия. Возможно, вы уже слышали о «принципе Парето». Также называемый законом Парето, принципом 80-20 или даже законом 80-20, это эмпирическое явление, наблюдаемое в определенных областях: примерно 80% следствий являются продуктом 20% причин. Хотя работы Парето не обязательно подразумевает распределение 80-20, Джозеф Джуран в 1954 году использовал выражение «принцип Парето» для его обозначения.

Другой термин, носящий его имя, связан с теорией игр. Пусть имеется система с несколькими частными показателями. Тогда система достигла оптимальности по Парето (стала эффективной по Парето), если при улучшении любого из показателей достигается ухудшение других.

Сам Парето высказывался так:

«Всякое изменение, которое никому не приносит убытков, а некоторым людям приносит пользу (по их собственной оценке), является улучшением»

Относительно исходной ситуации, улучшение по Парето — это новая ситуация, в которой некоторые агенты выиграют, а ни один агент не проиграет.

Ситуация называется доминируемой по Парето, если возможно улучшение по Парето.

Таким образом, система допускает локальные улучшения до тех пор, пока они не приносят никому вреда.

В своем «Руководстве по политической экономии» Парето рассматривает максимальную полезность для общества как свойство общего экономического равновесия и определяет ее как положение, при котором всякая малая вариация увеличивает полезность одних и уменьшает полезность других.

Полезность относится к полезности товара или услуги, ощущаемой данным экономическим агентом в данное время, в отличие от объективной полезности того же товара или услуги. Например, для путешественника в пустыне стакан воды субъективно будет стоить намного дороже, чем для человека в бассейне.

Таким образом, система допускает локальные улучшения, если они никому не вредят. Общее благо общества по Парето максимально в том состоянии, когда никакое изменение полученного оптимального распределения не наносит вреда благосостоянию хотя бы одного объекта системы. Например, в дилемме заключённых состояние «оба молчат» является Парето-оптимальным.

Но опять же возникает проблема. Философы, которые считают, что этот факт показывает противоречие между некооперативной и кооперативной теорией игр упускают из виду важность предположения в кооперативной теории игр о том, что могут быть сделаны жесткие договоренности. Не имеет значения, что Франкенштейн и Дракула обещали соблюдать соглашение. Они, например, могут договориться, но не сдержать обещания. Или же они могут затратить ресурсы на обеспечение нерушимости договора.

Фонтан с водой и оптимум Парето

Мы обсудим здесь ситуацию, описанную в статье одного французского исследователя.

В административном ресторане есть довольно классический для франции питьевой фонтан, оборудованный двумя кранами, с одной особенностью, которая кажется весьма распространенной: общий поток воды одинаков при работе одного или обоих кранов. Когда два человека приходят наполнить свои графины, они обычно делают это одновременно, используя оба крана. Это действительно хорошая идея?

Парето-оптимальность Математика, Теория игр, Джон Нэш, Парето, Популяризация, Дилемма заключенного, Длиннопост

Представьте себе, что первый человек, Гензель, подходит к фонтану, чтобы наполнить свой графин. Как раз в тот момент, когда он собирается начать налить себе водички, в свою очередь появляется второй человек, Гретель. У последней есть выбор между двумя стратегиями: активировать второй кран, чтобы наполнить ее графин одновременно с Гензелем, или подождать, пока тот не закончит, прежде чем начать делать это.

Когда работает только один из кранов, он наполняет графин примерно за 20 секунд. Когда оба крана открыты, каждый из них наполняет графин за 40 секунд. Если Гретель решит использовать второй кран, она и Гензель проведут у фонтана 40 секунд. Если же она решит подождать, Гензель проведет там только 20 секунд, а она 40 (20, чтобы подождать и 20, чтобы наполнить свой графин).

Таким образом, Гретель абсолютно ничего не выигрывает, если откроет второй кран, а Гензель в таком случае потеряет 20 секунд. Поэтому лучшим общим решением будет подождать и никогда не использовать оба крана одновременно.

В случае, который нас здесь интересует, есть две ситуации: одна, когда Гретель использует второй кран, и другая, когда она ждет, прежде чем наполнить свой графин. Вторая ситуация – оптимум Парето, но не первая, поскольку можно улучшить результат Гензеля (сократить его время у фонтана с 40 до 20 секунд), не ухудшив результат Гретель (у которой и так и так будет 40 секунд ожидания).

На самом деле, единственный плюс двух краников у таких фонтанов – это возможность поболтать с коллегой, пока наполняются графины, поэтому, несмотря на всю их нелогичность, во Франции они всюду =)

Попробуйте вспомнить, с какими примерами подобных ситуаций вы уже сталкивались в своей жизни?

Показать полностью 1

[моё] Математика Теория игр Джон Нэш Парето Популяризация Дилемма заключенного Длиннопост

Партнёрский материал

specials

Как подготовить машину к долгой поездке⁠⁠

Взять с собой побольше вкусняшек, запасное колесо и знак аварийной остановки. А что сделать еще — посмотрите в нашем чек-листе. Бонусом — маршруты для отдыха, которые можно проехать даже в плохую погоду.

ЧИТАТЬ

Поездка Путешествия Отдых Текст

Eriright

1 год назад

Серия Теория игр для начинающих

Равновесие по Нэшу⁠⁠

Прошлые посты тут:

Игра с природой, или что такое математическое ожидание? : Часть 1, Часть 2

Дилемма заключённого : Часть 1, Часть 2, Часть 3,

Частные и общественные блага: Часть 1, Часть 2

Немного классификации и терминов

Мы с вами уже построили платёжные матрицы в двух играх, проведём немного классификации.

В 1944 году за авторством Оскара Моргенштерна и Джона фон Неймана была опубликована книга «Теория игр и экономическое поведение» («Game Theory and Economic Behavior»), в которой:

- Было сформулировано определение «игры», как деятельности двух и более участников (игроков) имеющей условия некоего «выигрыша» и «проигрыша», в рамках которой все участники могут распоряжаться какими-то ресурсами и взаимодействуют между собой, преследуя цель «выиграть» и принимая решения, основанные на поведении других игроков;

- Был математически описан способ поиска оптимальных стратегий в такой игре (ведущих к «выигрышу» с какой-то определенной вероятностью).

Джон фон Нейман (1903—1957) – американский математик и физик венгерского происхождения. Он внес важный вклад во многие области. Тема упомянутой выше книги скорее связана с экономикой. На самом деле до 1930-х годов экономическая наука (по крайней мере, ее основные направления того времени) использовала большое количество числовых данных, но без какой-либо настоящей научной строгости. Это напоминало физику 17-го века, ожидающую языка и научного метода для выражения и решения своих проблем. В то время как классическая физика нашла решение в исчислении бесконечно малых, фон Нейман предлагает для экономики в характерном для нее аксиоматическом подходе теорию игр и теорию общего равновесия.

Суммой игры называется общий итог выигрышей и проигрышей.

В игре с нулевой суммой выигрыш одной стороны равен проигрышу другой. Некоторые карточные игры – преферанс, покер, бридж – есть игры с нулевой суммой. Игры с отрицательной суммой тоже имеются − например, лотереи (если считать сумму участников и не учитывать организаторов).

Команда, выступающая как единое целое, тоже может считаться игроком.

Антагонистической игрой называется игра двух игроков с нулевой суммой – выигрыш одного игрока оборачивается проигрышем другого.

Первым значительным вкладом фон Неймана в 1928 году стала минимаксная теорема, которая утверждает, что в игре с нулевой суммой при полной информации (каждый игрок знает возможные стратегии своего противника и их последствия) у каждого есть набор предпочтительных («оптимальные») стратегии. В игре между двумя рациональными игроками нет ничего лучше для каждого из них, чем выбрать одну из этих оптимальных стратегий и придерживаться её.

Существуют игры с количеством участников, большим двух. Эти игры можно разделить на два класса – кооперативные, когда разрешено нескольким участникам вступать в коалицию (например, в преферансе при розыгрыше мизера обычно два игрока играют против одного в пределах одной партии). В некооперативных играх каждый участник играет только за себя.

В спортивных играх – командных (футбол, хоккей) или личных (шахматы) каждый матч или партия есть игра с нулевой суммой по результатам (ничья, или же один выигрывает, а другой проигрывает). Хотя в турнирных таблицах фигурируют общие набранные очки, в шахматах, например, считают именно «плюсы» – разницу между выигранными и проигранными партиями. В футболе, в связи с борьбой с ничьими, ничейный результат невыгоден обоим. Но если брать именно набранные очки, то турнир – игра с положительной суммой.

Равновесие по Нэшу

Джон Нэш (John Forbes Nash) (1928-2015) в теории игр был признан второй звездой после фон Неймана. Родился в 1928 г., изучал математику в Принстоне и скоро проявил интерес к теории игр. В своей диссертации (1950) двадцатидвухлетний Нэш сформулировал понятие, которому суждено было изменить теорию игр. Кстати, по мотивам его жизни был снят фильм «Игры разума», весьма советую к просмотру.

Термин «равновесие по Нэшу» настолько популярен, что сам Нэш стал бы миллионером, если бы ему платили по доллару за каждое упоминание о нём. Во всяком случае, профессором MIT он стал. А также Нэш – единственный математик и экономист, удостоенный Нобелевской премии по экономике в 1994 году и Абелевской премии по математике в 2015 году.

Вначале Нэш исследовал игру двух игроков с ненулевой суммой, затем объектом его исследований стали некооперативные игры с тремя и более участниками. Нэш вначале выдвинул понятие о равновесии в таких играх, затем доказал, что оно существует для любых конечных игр с любым числом игроков. До него фон Нейманом было доказано только равновесие в играх двух лиц с нулевой суммой.

Исследования Джона Нэша принесли ему Нобелевскую премию по экономике в 1994 году совместно с Джоном Харсаньи и Райнхардом Селтеном. Нобелевский комитет пояснил, что Харсаньи премирован за «распространение равновесия по Нэшу на класс игр с неполной информацией», а Селтен – за обогащение этого равновесия.

Мы видим, что равновесие по Нэшу привело троих учёных к Нобелевской премии (хотя это была математика, премию дали за экономику, математикам Нобелевские премии не положены). Так что же это такое, равновесие по Нэшу?

Равновесие по Нэшу – ситуация в игре, в которой ни один из игроков не может улучшить свое положение, односторонне изменив свою стратегию, если другие игроки свои стратегии не меняли.

Каждый из игроков в равновесии по Нэшу осведомлён о стратегиях других игроков и в связи с этим выбирает для себя лучшую из доступных ему стратегий. В равновесии по Нэшу действует принцип «оглашения» – если все игроки огласят свои стратегии, ни один из них не захочет изменить свою. Это приводит к выводу, что каждому из игроков невыгодно в одностороннем порядке менять свою стратегию – система находится равновесии. Для его поддержания не требуется внешних сил, каждый из игроков старается реализовать в создавшихся условиях именно свою стратегию, и равновесие нарушать невыгодно каждому из игроков. Именно здесь кроется различие между кооперативными и некооперативными играми – для устойчивости первых могут потребоваться внешние силы (например, обращение в суд), устойчивость вторых же внешних сил не требует.

К сожалению, встречаются такие ситуации, когда такое устойчивое состояние возникает в невыгодной для всех ситуации. Если бы все изменили свои стратегии, система пришла бы к более выгодному состоянию для всех, но для этого необходимо сотрудничество всех, которое невозможно в некооперативных играх, а попытка любого из игроков изменить для себя стратегию приводит к ещё более худшим результатам. Упомянутая ранее дилемма заключённого – один из случаев стабильно плохой по Нэшу ситуации для всех.

Показать полностью

[моё] Математика Теория игр Дилемма заключенного Джон Нэш Популяризация Длиннопост Текст

Eriright

1 год назад

Серия Теория игр для начинающих

Частные и общественные блага: Часть 2⁠⁠

Прошлые посты тут:

Игра с природой, или что такое математическое ожидание? : Часть 1, Часть 2

Дилемма заключённого : Часть 1, Часть 2, Часть 3

Частные и общественные блага: Часть 1

Сегодня мы продолжим обсуждать частные и общественные блага.

Другой пример касается перевозки грузов в Китае, о которой я узнала из книги Стивена Ландсбурга. 100-150 лет назад в Китае был распространен следующий способ перевозки грузов: плотненько так утрамбовывали телегу, которую потом тащили шесть человек. Клиенты платили только тогда, когда товар был доставлен вовремя. Представьте, что вы один из шести человек. Можно приложить усилие и тянуть изо всех сил. Если все будут делать так же, груз прибудет вовремя. Если кто-то этого не сделает, все также прибудут вовремя. Поэтому каждый из этой шестёрки думает: «Если все тянут изо всех сил, зачем мне это делать, а если не все стараются, то я все равно не смогу ничего поменять, и зачем же стараться.» В итоге, как вы можете догадаться, все было очень плохо. Что же сделали грузчики? Они сами нашли решение: наняли седьмого человека и заплатили ему за то, чтобы он хлестал лентяев. Само его присутствие заставляло их работать изо всех сил, иначе все они впали бы в такой себе дисбаланс, из которого никто в отдельности не смог бы выйти.

Частные и общественные блага: Часть 2 Математика, Теория игр, Дилемма заключенного, Популяризация, Длиннопост

Тот же пример можно наблюдать в природе. Дерево, растущее в саду, отличается от дерева, растущего в лесу, своей кроной. В первом случае она окружает весь ствол, во втором – является пышным только вверху. В лесу мы говорим о равновесии Нэша. Если бы все деревья согласились и росли одинаково, они бы распределяли количество фотонов поровну, и всем было бы лучше. Но никому это не выгодно. Поэтому каждое дерево хочет стать немного выше окружающих его.

Проблема безбилетника в теории общественных благ не в том, что его поведение неэтично. Именно наличие индивидуумов с такой стратегией может привести к тому, что коллективные действия не состоятся и общественного блага просто не будет. Наличие этих «тунеядцев», готовых «бесплатно» пользоваться общим ресурсом, может привести к тому, что остальные члены группы откажутся от общего проекта.

Игра со взносами в общий фонд

Предлагаем вам, по традиции, игру, в которую вы сможете сыграть со своими друзьями.

Поскольку это не так называемая игра с нулевой суммой, играть на очки проще, чем на копейки. Перед каждым раундом каждый игрок получает по 10 очков.

Вы должны решить, какую часть именно этой суммы вы оставите себе, а какую отдадите в общий фонд.

После этого ведущий удвоит сумму общего фонда и разделит ее поровну между абсолютно всеми участниками игры, независимо от того, делали ли они взносы в фонд или оставляли всю сумму себе.

Как и в предыдущих играх, на бумажках со своим именем вы должны написать сумму своего вклада в общий фонд. После этого ведущий подводит итоги тура.

Фактически, здесь, как и во всех предыдущих играх, сохранение общей суммы при себе является доминирующей стратегией. Давайте объясним это.

Пусть была группа из четырёх игроков. Независимо от действий других игроков, если первый игрок решит внести 2 очка в общий фонд, то после удвоения сумма в общем фонде увеличится на 4 очка. Но при этом 3 очка достанется другим, а ему только одно очко, значит, игрок потеряет ещё больше денег, если вложит больше, и выиграет, если размер его взноса сократится. Интересно, что такая стратегия локально выгодна для игрока, независимо от того, вкладывают ли другие игроки деньги в фонд.

Так как каждый участник рассчитывает на то, что он получит выгоду от того, что станет «зайцем», не внося средств в фонд, то эта стратегия становится доминирующей. Все игроки, согласно этой стратегии, денег в фонд не внесут и, следовательно, выигрыша не получат! Если в автобусе окажутся одни зайцы, водитель не поедет. А ведь им достаточно всем было внести по 10 очков и каждый получил бы выгоду.

Это не только предмет лабораторного эксперимента или теоретического исследования; в эту игру играют в реальном мире в случаях социального взаимодействия, когда общее благо может быть создано только за счет добровольного вклада членов группы, но доступ к нему не может быть закрыт для членов группы, которые не внесли свой вклад в общее дело. Возможно, самый интересный вариант этой игры возникает, когда игрокам предоставляется возможность наказать тех, кто нарушает соглашение о социальном сотрудничестве по умолчанию. Однако связанные с этим расходы должны нести все участники.

После завершения игры со взносами в общий фонд информация о взносах каждого игрока сообщается всем остальным. Затем наступает второй этап игры, когда каждый игрок может совершать действия, направленные на уменьшение выигрыша других. Это будет стоить ему (например, трети балла) за каждое выбранное им сокращение выигрыша соперника. Другими словами, если игрок решит уменьшить выигрыш одного из соперников на три очка, это будет стоить ему одного очка. Освободившиеся в результате такого сокращения баллы никому не передаются, а возвращаются в кассу экспериментатора.

По той же логике транспортные операторы нанимают контролеров. Их найм влияет на цены билетов, но в то же время их действия направлены на предотвращение мошенничества и, следовательно, ограничение потерь операторов и, как ни странно потери пользователей так же уменьшатся.

Показать полностью 1

[моё] Математика Теория игр Дилемма заключенного Популяризация Длиннопост

Eriright

1 год назад

Серия Теория игр для начинающих

Частные и общественные блага⁠⁠

Прошлые посты тут:

Игра с природой, или что такое математическое ожидание? : Часть 1, Часть 2

Дилемма заключённого : Часть 1, Часть 2, Часть 3

Для того, чтобы в некоторых задачах проще было математизировать принимаемые решения, озвучим два определения из экономики:

Общественное благо является неконкурентным и неисключаемым благом.

Таким образом, потребление этого товара агентом не влияет на количество, доступное другим агентам (неконкуренция). Чистое общественное благо – это неконкурентное и неисключаемое благо, за доступ к которому трудно взимать плату (неисключаемость). Это, например, дороги, леса, скамейки на улице. Каналы YouTube также можно считать общественным благом. Это неконкурентное благо в том смысле, что когда кто-то смотрит YouTube, это не мешает любому другому человеку тоже смотреть то же видео. Это неисключаемое благо в том смысле, что интернет-технологии не позволяют ограничить доступ к этому благу тем, кто его финансирует. Понятие глобального общественного блага также обозначает очень обширные общественные блага, такие как качество воздуха, биоразнообразие или глобальная климатическая ситуация. Или даже глобальная эпидемиологическая ситуация. Это довольно обсуждаемые вопросы в наши дни, не так ли?

Частное благо – это конкурирующее и исключаемое благо.

Владение частным благом означает, что только владелец этого блага (физическое или юридическое лицо) может определять, как она может быть использована. Соперничество за благо заключается в том, что если я потребляю это благо, то кто-то другой также не может его потреблять. На самом деле говорят, что товар подлежит исключению, если определенные люди не имеют к нему доступа.

Если же сформулировать совсем по-простому, то можно сказать и так:

Частные блага – это то, что люди потребляют сами.

Общественные (коллективные) блага являются благами, которыми при их наличии может пользоваться любой – например, это дорожная сеть, лавочки у подъезда (даже если бабульки считают иначе), и так далее.

Существуют и другие виды благ, но двумерная классификация, предложенная Остромом и Остромом в 1977 г., до сих пор считается классической для частных и общественных благ.

А теперь мы сформулируем очень простую модельную задачу, связанную с понятием общественного блага:

Пусть у нас есть очень маленькая страна с двумя гражданами, живущими в одном доме. Каждый человек либо может заплатить 3 рубля за установку отпугивателя комаров рядом с их домом, либо не платить. Если установлена хотя бы одна отпугивалка, то всё хорошо, если не установлена --- граждан покусают злые малярийные комары, и им придётся потратить по 2 рубля на лечение.

Частные и общественные блага Теория игр, Математика, Дилемма заключенного, Популяризация, Длиннопост

Данную задачу, опять же, можно сформулировать на языке матриц платежей,

Опять же, как и в дилемме заключенных, видно, что каждый будет надеяться на другого, и придётся лечиться. А если бы они дружили, они могли бы просто скинуться по 1.5 рубля, и все оказались бы в выигрыше...

Проблема безбилетника

А что будет, если рассматривать задачу с гораздо большим количеством игроков?

Тот факт, что один или несколько человек могут извлечь выгоду из общего блага, ресурса или услуги, стремясь избежать уплаты взноса или уменьшить его, наблюдался с античных времен и регулярно комментируется, особенно в современную эпоху. Можно заметить, что Главкон в «Республике» Платона видит логику своего аргумента против повиновения закону, если только можно избежать наказания за нарушение. Ранние читатели Платона часто удивляются тому, что дорогой старый Сократ, кажется, не понимает его логики и настаивает на том, что в наших интересах подчиняться закону, несмотря на сдерживающий эффект наказаний.

Аргумент Адама Смита о невидимой руке, которая поддерживает конкуренцию продавцов, а не сговор, задуман как фундаментально важный и благотворный, даже полезный пример логики коллективных действий.

Обратная сторона невидимой руки снижает усилия по ценовому сговору, тем самым подталкивая производителей к инновациям.

Джон Стюарт Милль по той же логике защищает законы, утверждающие максимум рабочего времени. Он предполагает, что всем рабочим было бы лучше, если бы рабочий день был сокращен, скажем, на десять-девять часов в день для всех. В то же время, каждому отдельному рабочему было бы лучше работать дополнительный час, если большинство других этого не делают. Таким образом, единственный способ получить выгоду от сокращения рабочего дня – это объявить незаконным работу более девяти часов в день. Я думаю, вам нравится логика работать меньше (если вы получаете ту же зарплату, конечно!). С этой точки зрения в мире довольно хорошо известна Франция со своими 35 часами занятости в неделю на полной ставке.

Рассмотрим электрички и «зайцев», то есть, безбилетников. Что произойдёт, если все пассажиры перестанут платить за билеты и станут «зайцами»?

− Абсолютно все? Невозможно!

− Ладно, большинство.

− И это невозможно. Во-первых, имеются контролеры и штрафы. Во-вторых, «сознательные люди» будут всегда.

− Ладно, пусть «зайцев» будет 20%. Это правдоподобно. Транспортники будут терять пятую часть своего дохода. Это приведёт к росту цен на поездки. Сознательные пассажиры станут оплачивать безбилетников.

Но это лишь одна сторона проблемы «зайца». Если людям действительно нужен маршрут, то при повышении оплаты за проезд они ездить не перестанут.

Но вот другая ситуация. Представим сельскую местность и группу фермеров, производящих продукцию. Плохие дороги – дорогая доставка. Фермеры решили вложить средства в постройку дороги, которая удешевит доставку продукции, и которая быстро окупится. Это выгодно всем. Поэтому один фермер решил не вкладывать свои средства, ведь дорогу построят и без них. Как только его сосед узнал об этом, он тоже решил отказаться. В результате дорогу так и не построили.

Проблема безбилетника в теории коллективных благ не в том, что его поведение неэтично. Она в том, что наличие особей с такой стратегией может привести к тому, что коллективное действие не состоится. Наличие «зайцев», готовых воспользоваться общим ресурсом «на халяву» приводит к тому, что остальные участники группы совсем отказываются от совместного проекта.

А с какими же примерами проблемы безбилетника связывались вы, читатели Пикабу, в своей жизни? Делимся!

Показать полностью 4

[моё] Теория игр Математика Дилемма заключенного Популяризация Длиннопост

Eriright

1 год назад

Серия Теория игр для начинающих

Дилемма заключённого : Часть 3⁠⁠

Прошлые посты тут:

Игра с природой, или что такое математическое ожидание? : Часть 1, Часть 2

Дилемма заключённого : Часть 1, Часть 2

Дилемма заключённого : Часть 3 Теория игр, Дилемма заключенного, Математика, Популяризация, Длиннопост

Дилемма заключенного в политике

В политике тоже можно встретить дилемму заключенного. Представим два государства, которые вовлечены в гонку вооружений. Эти государства имеют две стратегии: увеличить вооружения и расходы на них либо сокращать вооружения и расходы на них. При этом очевидным образом выполняются постулаты дилеммы заключённого (D > C > d > c) :

D – «мы вооружились, а противник – нет» – наилучший исход, наибольшая безопасность. А еще мы можем завоевать вторую страну!

C – «никто не вооружился» – если ни у кого нет армии, царит мир и у стран нет военных расходов. Ситуация сотрудничества, позволяющая каждой не иметь армии, очевидно предпочтительнее ситуации, когда обе страны армии содержат, но она нестабильна: у каждой из двух стран есть сильный стимул в одностороннем порядке вооружить армию для господства над другой.

d – «оба вооружились» – Если у обоих есть армии примерно равной силы, война менее «заманчива», потому что она очень затратна; это была ситуация холодной войны. Военные расходы и гонка вооружений – это чистый убыток для обеих стран.

c − «мы не вооружились, а противник вооружился» − Если только у одного есть армия, он, очевидно, может победить другого без единой потери. Настоящая катастрофа, не так ли?

С точки зрения первой страны, если вторая не вооружается, то выбор у нас стоит между вариантами D и C лучше бы нам вооружиться. Если же вторая страна вооружается, то для первой страны, выбор стоит между d и c и опять-таки выгоднее вооружаться, нам ведь так будет поспокойнее. Так что каким бы ни был выбор второй страны, первой лучше вооружиться. Ситуация для второй страны совершенно аналогична, и в итоге обе стороны будут стремиться к военной экспансии.

Показать полностью 3

[моё] Теория игр Дилемма заключенного Математика Популяризация Длиннопост

Eriright

1 год назад

Серия Теория игр для начинающих

Дилемма заключённого - часть 2⁠⁠

Прошлые посты тут:

Игра с природой, или что такое математическое ожидание? : Часть 1, Часть 2

Дилемма заключённого : Часть 1

«Дилемма заключенного» – это «игрушечная» игра. Вы можете не ожидать оказаться в такой ситуации, но подобные эффекты окружают нас повсюду. Рассмотрим эту «дилемму» с большим количеством действующих лиц, которую иногда называют «общественной трагедией».

Например, на дорогах бывают пробки, и у меня есть выбор: ехать на работу на машине или на автобусе. Другие участники дорожного движения также будут принимать свои решения. Если я возьму машину, и все решат подобное одновременно, то будет пробка, но в целом все будут сидеть в относительно комфортных персональных автомобилях. Если я поеду на автобусе, то пробка всё ещё никуда не исчезнет (мы предполагаем, что другие участники игры своего решения не поменяли), но я, сидя в автобусе, чувствую себя менее комфортно, да ещё и он не объезжает пробки по обочинам, так что этот результат еще хуже. Если все едут на автобусе, то я, сделав так же, доберусь до работы достаточно быстро и без пробок. Но если я в таких условиях поеду туда на машине, то доберусь так же быстро, но ещё и с комфортом. Таким образом, наличие пробки не зависит от моих действий. У нас тут есть так называемое равновесие Нэша: в данном случае, все рациональные игроки предпочитают ездить на машине (если она у них есть и мы не принимаем во внимание такие дополнительные факторы, как цена бензина, цена билета на транспорт, и т д). Что бы ни делали другие, я лучше выберу машину, потому что не важно, будет ли пробка или нет, я все равно доберусь с большим комфортом, чем если поеду на автобусе. Это доминирующая стратегия. Так что в итоге каждый ездит на своей машине, что мы зачастую видим в крупных городах. Одна из целей государства – сделать общественный транспорт лучшим вариантом для наибольшего числа людей, поэтому существуют городские сборы, парковки и т. д. В этом случае платежные матрицы меняются, и равновесие становится другим.

Еще одна классическая история касается рационального невежества избирателей. Представьте, что вы не знаете результатов выборов заранее. Вы можете изучить программу всех кандидатов, послушать дебаты и проголосовать за лучших. Вторая стратегия заключается в том, чтобы пойти на избирательный участок и проголосовать случайным образом или за того, кого чаще всего видели по телевидению (ну или о ком больше всего слышали от друзей). Каково оптимальное поведение, если мой голос никогда не будет решающим (всё-таки, во Франции, а автор книги говорит именно об этой стране, население составляет 67 миллионов человек)? Конечно, я хочу, чтобы в стране был хороший президент, но я знаю, что больше никто не будет внимательно изучать программы кандидатов. Поэтому не тратить время на эту тему – доминирующая поведенческая стратегия.

Дилемма заключённого в группе. Игра в конкурирующие фирмы.

Поскольку у вас, вероятно, есть несколько друзей, вы можете захотеть попробовать поиграть во что-то, подобное «дилемме заключенного» сразу в группе. Рассмотрим одну из версий дилеммы заключенного в группе.

В аналогичную игру играл профессор Рэймонд С. Батталио из Texas A&M University.

Представим, что все вы – владельцы гипотетических компаний, и все вы должны решить, какой объём продукции, например, треуголок, будет выпускать ваша компания. Это решение нужно написать на листке бумаги, независимо от окружающих (лучше в тайне от них). Листочки надо подписать и кинуть, например, в шляпу.

Дилемма заключённого - часть 2 Теория игр, Дилемма заключенного, Математика, Популяризация, Книги, Длиннопост

Если вы хотите выпускать 1 единицу товара, то совокупное предложение сохранится на низком уровне, а, соответственно, цены – на высоком.

Если вы хотите выпускать 2 единицы товара, то вы получите дополнительный доход за счёт других, но цены уменьшатся.

Чтобы не углубляться совсем в экономику, пусть ваш выигрыш будет осуществляться по следующей схеме:

Таким образом, люди, решившие изготовить 2 треуголки, всегда будут получать на 7 баллов больше, чем люди, решившие произвести только одну. Но с другой стороны, чем больше людей решат произвести 2 треуголки, тем ниже их совокупный выигрыш.

Вы также можете снова сыграть в ту же игру, теперь вы должны предварительно обсудить свои стратегии друг с другом.

Изменились ли ваши результаты, когда вы предварительно обсудили свои стратегии? Если да, то с чем это может быть связано?

Эксперименты с реальным денежным выигрышем, проведенные в МФТИ, показали, что большинство участников сделали выбор в пользу производства двух треуголок. Игры для сотрудников RATP Smart Systems были без реального вознаграждения, там выбор участников игры был более однородным (примерно поровну «эгоистов» и «альтруистов»).

Теоретическое и практическое значение этой дилеммы огромно. С теоретической точки зрения это очень просто доказывает, что индивидуальный интерес может резко противоречить интересу коллективному: здесь мы находим явный предел либеральной концепции экономики, постулирующей существование механистической природы («невидимой руки» рынка Адама Смита или «аукциониста» Леона Вальраса), делающей возможным достижение коллективного благополучия исключительно благодаря стремлению к благополучию индивидуальному.

Показать полностью 2

[моё] Теория игр Дилемма заключенного Математика Популяризация Книги Длиннопост

Посты не найдены

12 Далее