Последовательные игры- продолжение
Продолжим вопрос о свидании Мата Хари и Мюнхаузена, начатый в предудущем посте из серии.
При внимательном рассмотрении становится ясным, что рассмотренная в игре угроза на самом деле угрозой не является. Ведь очевидно, что как только Мюнхаузен сделает свой выбор, возможными выигрышами Мата Хари могут быть либо 0, либо 1, так что пусть уж это будет 1.
Проблема Мата Хари в том, что после того, как Мюнхаузен делает свой выбор, он ожидает рационального поступка от неё. Она могла бы себя связать обязательством съесть суши даже в том случае, если бы Мюнхаузен привёл её в кошерный ресторан, возможно, это могло бы улучшить её настроение.
Связать себя таким обязательством можно, например, позволив кому-нибудь другому сделать за себя. Мата Хари, например, могла бы нанять кузнеца и поручить ему заставить её есть суши в данном случае. Однако, с точки зрения Мюнхаузен, ситуация в этом случае решительно меняется.
Если он знает о договорённости Мата Хари с кузнецом, то он понимает, что если он приведёт Мата Хари не в японское кафе, его вечер будет безнадёжно испорчен. Поэтому для него разумнее пойти на поводу у девушки. В данном случае женский ультиматум помог повысить настроение Мата Хари.
Как вообще назвать равновесие, возникающее в данной игре?
Стратегии и равновесия в этом типе игр изучал барон Генрих фон Штакельберг (1905-1946), немецкий экономист. Конкуренция по Штакельбергу — это модель дуополии. Дуополия Штакельберга асимметрична, то есть две конкурирующие фирмы не обладают одинаковой властью. Мы говорим о фирме-лидере (или фирме-пилоте) и фирме-сателлите, ведомой фирме. Здесь пилот - барон Мюнхгаузен.
Равновесие в этой и ей подобных играх называется равновесием Штакельберга. В таких играх имеется лидер, игрок, который делает первый ход. Лидер может определить стратегии, определяющиеся равновесием Нэша, после каждого из своих ходов. Мы полагаем при вычислении данного равновесия, что ведомый рационален и выбирает стратегии согласно прогноза лидера.
Например, в рассмотренной игре, равновесием Штакельберга является шаурма из кошерного ресторана.
Теория игр в футболе
Чемпионат мира по футболу в полном разгаре. Привнесем в него немного науки. Футбол в полной мере соответствует так называемой «теории игр» - раздел математической экономики, изучающий решение конфликтов между игроками и оптимальность их стратегий. Так вот, незнание основных постулатов теории игр порой приводит к довольно казусным ситуациям. И об одной из них и вспомнил Алексей Савватеев в своем недавнем интервью.
В Питере шаверма и мосты, в Казани эчпочмаки и казан. А что в других городах?
Мы постарались сделать каждый город, с которого начинается еженедельный заед в нашей новой игре, по-настоящему уникальным. Оценить можно на странице совместной игры Torero и Пикабу.
Реклама АО «Кордиант», ИНН 7601001509
Теория игр (начало)
Термин из Словаря по конфликтологии С.М. Храмова
О ТЕОРИИ ИГР ОДНОЙ СТРОЧКОЙ: это инструменты для анализа конфликтов.
Теория игр изучает формальные модели принятия решений в условиях конфликта.
Это математический метод, который позволяет проанализировать ситуацию и выбрать оптимальную стратегию поведения в конфликте, объяснить или изменить человеческое поведение.
Теория игр является общепризнанным инструментом консультирования и прогнозирования.
«Становлению теории принятия решений во многом содействовали в качестве изобретателей теории игр Е. Борель (1871-1956) и Дж. фон Нейман (1903-1957)».
Источник — портал VIKENT.RU: https://vikent.ru/enc/5746/
«Фактически, теория игр была первоначально разработана американским математиком венгерского происхождения Джоном фон Нейманом и его коллегой из Принстонского университета Оскаром Моргенштерном, американским экономистом немецкого происхождения, для решения экономических проблем.
В своей книге „Теория игр и экономического поведения“ (1944) фон Нейман и Моргенштерн [...] заметили, что экономика во многом похожа на игру, в которой игроки предвосхищают ходы друг друга, и поэтому требует нового вида математики, которую они назвали теорией игр. (Название может быть несколько неправильным — теория игр обычно не разделяет веселья или легкомыслия, связанного с играми)».
Game theory (пер. с англ). URL: https://www.britannica.com/science/game-theory (дата обращения: 29.08.2021).
«Томас Шеллинг использовал теорию игр, которая дает возможность принятия рациональных решений в условиях дефицита информации. Его базовым трудом стала «Стратегия конфликта», опубликованная в пятидесятые годы прошлого века. В своей книге Шеллинг показывает, НАПРИМЕР, что способность принять ответные меры может быть иногда более полезной, чем способность выдержать атаку, или что «возможное неизвестное возмездие часто более эффективно, нежели известное неотвратимое возмездие».
Велетминский И. Доигрались. Нобелевская премия в области экономики присуждена двум ученым за теорию игр // Российская газета — Столичный выпуск № 0(3896). 2005. 11 окт. URL: https://rg.ru/2005/10/11/nobel.html (дата обращения: 29.08.2021).
В 1994 году за исследования в области теории игр Нобелевская премия по экономике была вручена американскому математику Джону Нэшу, специализировавшемуся на стратегическом моделировании.
Ричард Даффин — преподаватель Нэша в Политехническом институте Карнеги — называл своего ученика гением математики.
Д. Нэш являлся прототипом главного героя фильма «Игры разума» (США, 2001 г.).
Этот фильм удостоен четырех Оскаров.
Исследователь исходил из того, что есть разные люди. У каждого свой набор действий. В итоге сочетание таких действий приводит к определенному результату.
Д. Нэш придумал общий способ определять равновесие в конфликтной ситуации.
Равновесие по Нэшу — такая ситуация, когда человек ожидает определенное поведение других людей и в связи с этим не меняет свое действие.
Иллюстрирующий пример равновесия
Вы едете по своей стороне улицы на автомашине, а не по противоположной стороне = участвуете в равновесии по Нэшу.
Алгоритм поиска равновесия по Нэшу
1. Разложить ситуации на составляющие.
2. Осуществить поиск равновесия.
Наличие неопределенности и дефицита информации в условии решаемой задачи не является препятствием для применения теории игр.
Теория игр «создает условия, в которых участники играют друг против друга, получая различные награды в зависимости от своего поведения, и пытаются понять, когда выгоднее сотрудничать, а когда подставить.
[...] первой беспроигрышной стратегией считалась стратегия под названием „Зуб за зуб“. Вы начинаете с сотрудничества. Как только вас подставляют, вы в следующем круге платите обидчику той же монетой. Если оппонент решает возобновить сотрудничество, вы делаете то же самое.
Однако всегда есть вероятность ошибки. По какой-то причине игрок, который сотрудничает, может показаться партнёру обманщиком.
[...] стратегия „зуб за зуб“ допускает возможность ошибки и оказывается, она не так уж хороша. Поэтому новой „беспроигрышной“ стратегией назвали стратегию „прощения“. Она заключается в том, что один из игроков поступается своими принципами и прощает предательство, чтобы восстановить сотрудничество. Однако вскоре выяснилось, что и эта стратегия имеет свою уязвимость — „прощающего“ легко использовать».
Конспект лекции профессор биологии Стэнфордского университета Роберта Сапольского «Поведенческая эволюция. Достаточно лишь сравнить размеры самцов и самок, чтобы понять социальное устройство внутри вида» // Наука и жизнь. 2021. № 8. URL: https://www.nkj.ru/open/36341/ (дата обращения: 29.08.2021).
При конфликте затрагиваются интересы двух или более сторон.
Варианты возможных интересов игроков
— схожие интересы,
— противоположные интересы,
— смешанные интересы.
Классификация игр
А) По количеству игроков:
— игра для одного человека,
Пример игры для одного человека: человек, решающий, брать с собой на улицу зонт или нет.
— игра для двух человек,
— игра для N человек (где N — больше двух).
Б) По степени совпадения или противоречия целей игроков:
— некооперативные игры с нулевой суммой (у сторон конфликта интересы полностью противоположны, выигрыш одного игрока = проигрышу другого),
— кооперативные (коалиционные) и некооперативные игры с ненулевой суммой (у сторон есть как общие, так и противоположные интересы).
Неформальные обозначения антагонистических игр: «игра в цыпленка» (game of chicken), «ястребы и голуби» (hawks and doves), и описывается в реалиях русского языка как «брать на слабо/кто струсит первым».
Цель подобной игры-противостояния — заставить другого игрока сдать позиции первым под психологическим давлением и получить весь выигрыш«.
Вильданова Г.А., Кожухова И. В. Коммуникативные ресурсы антагонистической игры в современном американском политическом дискурсе // Вестник ТГПУ (TSPU Bulletin). 2019. 9 (206). С. 85.
Элементом реализации стратегий с нулевой суммой могут быть публикации в СМИ.
Пример. «Особой популярностью пользуются токсичные посты Д. Трампа в „Твиттере“, изобилующие оскорбительными ярлыками и пропитанные агрессивной риторикой в адрес неугодных политику личностей».
Вильданова Г.А., Кожухова И. В. Коммуникативные ресурсы антагонистической игры в современном американском политическом дискурсе // Вестник ТГПУ (TSPU Bulletin). 2019. 9 (206). С. 87.
Теория безумца
Суть стратегической «теории безумца» «состоит в устрашении противника путем внушения ему мысли, что у власти находится неадекватный человек, способный на крайние меры, в том числе на применение ядерного оружия. Р. Никсон применял „стратегию безумца“ для давления на Советский Союз во время войны во Вьетнаме, однако в целом данная концепция показала себя неэффективной».
Вильданова Г.А., Кожухова И. В. Коммуникативные ресурсы антагонистической игры в современном американском политическом дискурсе // Вестник ТГПУ (TSPU Bulletin). 2019. 9 (206). С. 88.
При реализации среднесрочных стратегий целесообразно применять игры с ненулевой суммой.
Описание пункта «Б» классификации игр в методической литературе
«В теории игр выделяются два класса:
1) игры со строгим соперничеством (или, что равнозначно, с нулевой суммой), когда два игрока имеют прямо противоположные интересы: один выигрывает столько, сколько проигрывает другой;
2) игры с нестрогим соперничеством (или с ненулевой суммой), где возможен обоюдный выигрыш.
Игры с ненулевой суммой, предоставляющие возможность как конкурентного, так и кооперативного поведения сторон, как раз и были избраны моделью для изучения конфликтного взаимодействия и определяющих его факторов».
Полозова Т.А. Методические проблемы изучения межличностного конфликта в группе. 1980. № 4. С. 124.
Пример игры для двух человек с нулевой суммой
Шахматы, в которых возможно только три исхода — белые выигрывают, черные выигрывают, ничья.
Примеры игры для двух человек с ненулевой суммой
1. Покупатель хочет более низкую цену за товар, а продавец — более высокую. Вместе с тем, оба в итоге хотят заключить сделку.
2. Два конкурента могут не соглашаться по поводу многочисленных проблемы, но оба выигрывают, если избегают прямой конфронтации.
3. Два пилота, пытающиеся избежать столкновения в воздухе. Оба пилота выиграют, если между ними есть канал общения.
Окончание статьи будет опубликовано 13 апреля 2022 года
+ Ваши дополнительные возможности:
Видео: ЭНЦИКЛОПЕДИЯ / СЛОВАРЬ ТВОРЧЕСТВА VIKENT.RU: Стратегии личности
Пандемия, самоизоляция и теория игр
Почему люди нарушают самоизоляцию? Постараемся ответить на этот вопрос при помощи теории игр
Эпидемия COVID-19 шагает по миру. Нам приходится привыкать носить маски, тщательно мыть руки и проводить больше времени дома. Во многих странах был введён режим карантина и самоизоляции. Но будут ли люди осознанно сидеть дома во имя блага общества? Постараемся ответить на этот вопрос с помощью теории игр
Индекс самоизоляции в Москве
На момент написания этого поста пандемия длится уже больше двух месяцев. С момента обнаружения вируса прошло почти пол года. От эпидемии умерли сотни тысяч людей, страдает экономика всего мира. И это ещё не конец: не все страны преодолели плато заболеваемости, а учёные опасаются второй волны
SARS-CoV-2 – коронавирус-виновник такой ситуации – способен существовать всего около недели на металле и пластике, и ещё меньше на других поверхностях. Летучие мыши, и панголины, которые являются возможным источником вируса также не бегают по городам, заражая людей. Всё это время вирус распространяется от человека к человеку
Задумайтесь, как это странно. Вирус может быть обнаружен в дыхательных путях пациента в среднем около 2 недель после появления первых симптомов (в фекалиях – дольше). Было бы достаточно всем посидеть дома около месяца и не есть фекалии соблюдать правила гигиены для того, чтобы остановить распространение инфекции. Это бы спасло тысячи жизней и в конце концов пошло бы на пользу экономике. Почему же этого не произошло? Мир страдает от пандемии уже не первый месяц и с нетерпением ждёт появления вакцины
Выпадение всего одного звена в этой цепочке может спасти сотни людей. Оставайтесь дома: это спасает жизни
Если вы читаете этот пост не из будущего, то вам достаточно выглянуть в окно, чтобы дать ответ на этот вопрос. Во многих городах режим не является слишком строгим и люди могут свободно выходить на улицу. Ответственность за самоизоляцию лежит на плечах каждого. И каждый волен выбирать, выходить ему на улицу или оставаться дома
Поведение людей в таких ситуациях хорошо описывает теория игр. Давайте сделаем краткое отступление от эпидемиологии и поговорим о математике
Дилемма заключённого
Представьте 2 преступников, которые попались полиции. Каждый из них ограбил аптеку в надежде запастись медицинскими масками. Это уже не первое такое проишествие, но другие не были раскрыты. Полиция бросает преступников в разные камеры и допрашивает в надежде пролить свет и на прошлые ограбления
В наше время и балаклавы не нужны
Каждому из заключённых ставятся следующие условия. Он может засвидетельствовать, что второй грабитель совершил предыдущие преступления. Если второй грабитель при этом промолчит, то свидетеля отпустят, а на его коллегу повесят все прошлые ограбления и дадут срок 20 лет. Медицинские маски – это сейчас не шутки, знаете ли. Если и второй грабитель пожалуется на первого, то оба получат срок 5 лет. Если же оба промолчат, то им предстоит самоизолироваться в камере весь следующий год
Самый маленький суммарный срок, 2 года, получается, если оба грабителя промолчат. Это самое рациональное решение, если воспринимать преступников как единое целое, пусть и маленькое, общество. Однако они сами вряд ли думают о себе, как об обществе. Каждый из них заинтересован в том, чтобы лично его срок был как можно меньше. Тогда молчать будет нерационально, ведь оппонент также заинтересован в сокращении своего срока и охотно пожалуется, сократив его до нуля
Получается, что каждый из преступников не может дать своему оппоненту преимущество. Тогда действием с максимальной личной пользой будет сдать второго грабителя. Так поведут себя оба заключённых и в итоге оба сядут на 5 лет! При рациональных действиях, но ради личных мотивов, каждый заключённый проведёт на 4 года больше в тюрьме, чем мог бы при сотрудничестве. Зато оба не будут ходить по улице во время пандемии
Теория игр рассматривает такие и другие не менее интересные ситуации. Игрой в рамках этой теории называется конфликтная ситуация со следующими условиями:
1. Участвует некоторое конечное или бесконечное число игроков
2. Заранее заданы правила игры – способ выбора стратегии игроком
3. Определены количественные величины выигрышей и проигрышей участников игры
Дилемма заключённого соответствует этим правилам – в ней участвует 2 игрока, каждый имеет 2 возможных «хода» и стремится минимизировать свой срок, а этот срок определён при любых действиях игроков
Но как у любой другой области математики, прелесть теории игр в том, что она может описывать любые ситуации, модель которых вписывается в эти правила. С помощью этой теории можно объяснять экономические процессы, эволюцию, распространение религий. Игроками могут выступать предприятия, государства, отдельные люди или даже природные стихии
Как игру можно представить и соблюдение режима самоизоляции. Игроками здесь выступают жители города. Каждый день они «делают ход» – выбирают выйти сегодня погулять или остаться дома
Давайте построим простую модель, чтобы количественно определить возможный выигрыш. Зададим каждому человеку «настроение», выражаемое целым числом. Настроение будет повышаться на единицу, когда человек выходит погулять и понижаться на единицу, если он останется дома. Для простоты модели мы исключим из неё интровертов-домоседов. Если человеку приятнее сидеть дома, это прекрасно, но в рамках этой игры он нас не интересует
Теперь нужно определить правила, по которым каждый житель будет выбирать свой ход. В городе распространяется эпидемия и гуляя, игрок рискует заболеть. Пусть вероятность заболевания при выходе на улицу будет равна проценту заболевших от населения города. Например, если в городе 10% заражённых, то гуляя, человек имеет 10% вероятность заболевания. В таком случае его настроение опустится до нуля
Пусть игрок выходит на улицу, если математическое ожидание его настроения в этом случае будет больше его текущего настроения. То есть:
вероятность незаражения * (настроение + 1) > настроение
Простыми выкладками можно показать, что человек будет выходить на улицу, если его настроение выше, чем отношение количества здоровых людей к количеству больных людей в городе
Из этого следует что:
• При нулевом настроении, человек в любом случае пойдёт на улицу. Дома сидеть ему уже невмоготу
• При долгом сидении дома у человека накапливается усталость и ему всё больше хочется прогуляться. Рано или поздно может наступить момент, когда несмотря на количество заболевших в городе, человек выходит из дома, подвергая себя опасности и ещё больше ухудшая эпидемиологическую обстановку
Модель описана, давайте же посмотрим, как она себя ведёт. Для этого я написал небольшую программу. Кроме описанных выше правил я также добавил вероятность выздоровления для больных людей, равную 1/14 (в среднем за 2 недели человек выздоравливает). Такие люди становятся резистентными и более не распространяют инфекцию. В первый день болеет только один человек. Настроение у населения в начале распределено равномерно – от 1 до 15
Запустив модель 1000 раз для города с населением 1000 человек я получил такую картину:
По горизонтальной оси здесь отложены дни. Цветами показано среднее за 1000 запусков модели количество больных (красный), здоровых (синий) и резистентных (зелёный) людей. Чёрная линия отражает количество людей, вышедших на улицу в этот день. Белая линия – это среднее настроение всего населения, её ось можно увидеть справа
В самом начале болеет очень мало человек, поэтому большая часть людей выходит на улицу и среднее настроение населения повышается. Но очень скоро инфекция начинает стремительно распространяться и для многих людей порог риска оказывается выше их настроения. Они запасаются гречкой и туалетной бумагой и запираются дома (резкое падение чёрной линии). Это немного снижает скорость роста заболеваемости
Но настроение людей в такой ситуации становится всё хуже. Накапливается усталость и хочется выйти из дома. В какой-то момент настроение человека становится настолько низким, что его не пугает даже высокий процент заболеваемости. Люди снова начинают выходить на улицу, причём всё больше. На графике виден этот парадоксальный момент – заболеваемость приближается к пику, но люди гуляют всё больше и больше, ещё сильнее распространяя инфекцию!
Рано или поздно болеть или распространять инфекцию уже почти некому и она сходит на нет. Но на пике заболеваемость здесь достигла 40% населения города. Кстати, заметим, что «Резистентные» люди в этой модели почти не отличаются от погибших от заболевания: и те, и другие не распространяют болезнь. Поэтому можно воспринимать часть резистентных как погибших, а не как вылечившихся, хотя тогда они, конечно, не должны поднимать среднее настроение
Давайте теперь представим другой город, в котором после достижения порога в 1% заболеваемости был объявлен строгий карантин и всё население было обязано сидеть дома до тех пор, пока все заболевшие не вылечатся
Несмотря на то, что даже 1% – это колоссальное число для реальных городов, увеличим его до 10%, чтобы было проще смотреть на график
В обоих случаях порог достигается довольно быстро и население вынуждено сидеть дома. Это ведёт к драматическому падению настроения. Обратите внимание на правую ось – среднее настроение населения ушло в минус. Каждый конкретный человек чувствует себя значительно хуже, чем в первой ситуации (конечно, он остаётся здоровым, но мы не вписывали в модель тяжесть заболевания). Зато количество заболевших не преодолевает заданный порог. А после снятия карантина вновь можно свободно гулять и восстанавливать экономику. Общество в целом от этого выигрывает
С другой стороны, у этого есть ещё один интересный эффект. Количество переболевших людей невелико, а значит коллективный иммунитет у населения не формируется. И после снятия карантина первый же заражённый приезжий заставит картину повториться
Может быть именно поэтому в городах не вводится слишком строгий режим. Даже в модели с порогом в 1%, средняя длительность карантина составила 44 дня. За этот же период большая часть населения в модели без карантина приобрела резистентность. Поэтому суть самоизоляции не в том, чтобы остановить эпидемию, а в том, чтобы замедлить её распространение так, чтобы система здравоохранения справилась с поступающими больными. Это часто называют «сглаживанием кривой»
Оранжевая линия на гифке обозначает количество людей, которых способны обслужить больницы
Сделаем вывод. С точки зрения теории игр, человек будет нарушать режим самоизоляции пока его личный выигрыш от этого перевешивает возможные неудобства. К неудобствам относятся риск заболеть, штрафы, необходимость носить маски и так далее. Это именно тот рычаг, на который может воздействовать администрация страны/региона/города. Ведь большинство людей всё же думают о своём личном комфорте, а не о благополучии общества в целом. Даже если действия ради своих интересов приводят к худшей ситуации для общества и в конечном итоге для самого человека
Мне хотелось бы призвать вас быть ответственнее. Каждая мера безопасности, предпринятая вами, каждый день, проведённый дома, делает ваш город немного безопаснее. В конце концов, это хорошо и для вас
И напоследок: модели в посте не призваны точно отражать реальное положение дел, они несут скорее иллюстративный характер. Например, в них не учтён инкубационный период, хотя было бы интересно оценить его влияние. Также вероятность подхватить инфекцию зависит не только от доли заболевших в городе, но и от количества людей, которых человек встретит, гуляя. Но я стремился сократить количество параметров, чтобы передать лишь основную мысль. Почти не имеет смысла смотреть на абсолютные значения заболеваемости/длительности инфекции в этих моделях, но имеет смысл сравнивать ситуацию с карантином и ситуацию без карантина
Как говорил британский статистик Джордж Бокс:
Все модели неверны, но некоторые из них полезны
Спасибо за чтение, я буду рад вопросам (касательно математики, но не политики) и здравой критике. Оставайтесь дома! А если вам интересны мои посты, можете заглянуть в мою группу ВК и телеграм
О пробках
Джон Нэш и его теория игр
Личность Джона Нэша стала известна многим людям, далеким от мира науки, после выхода на большой экран фильма «Игры разума» с Расселом Кроу в главной роли. В определенной степени голливудское кино идеализирует математика, о чем упоминал и сам Джон после просмотра киноленты. Между тем есть более правдивый и почти никому не известный документальный фильм под названием «Игры разума».
В детстве Нэш ненавидел математику, и оценки в школе у него были соответствующие. Сам он в автобиографии говорит, что все изменилось после книги «Творцы математики». Она была написана так захватывающе и понятно, что по прочтении ему удалось самостоятельно доказать одну небольшую теорему.
Разумеется, Нэш поступил на математический факультет, а перед этим успел получить знания в области химической инженерии и международной экономики. За выдающиеся достижения по окончании учебы Джону дали не только степень бакалавра, но и магистра, и он отправился покорять Принстонский университет. В кармане у Нэша была рекомендация от бывшего преподавателя, в которой кратко значилось: «Он гений математики».
Бывшие сокурсники утверждают, что Джон был одержим деньгами и неимоверно скуп. Однажды дошло до того, что он по шуточному совету пошел искать банк, который бесплатно выдавал бы конверты и марки при обслуживании расчетного счета. Найти такое учреждение ему не удалось.
В годы учебы завязался его первый серьезный роман, который не особенно известен широкой общественности. Романтическая связь окончилась болезненным разрывом. В результате этих отношений у Джона родился сын, с которым он никогда не общался.
Несмотря на любовные перипетии, Нэш ни на йоту не отклонился от заданного курса. Ему был 21 год, когда в Принстоне он написал диссертацию по теории игр. Через 45 лет именно за нее он получит Нобелевскую премию по экономике.
После окончания аспирантуры Джон остался преподавать в Принстоне и по совместительству трудился в частных компаниях. Ему было 26 лет, когда полиция задержала его за непристойное поведение. Мы не знаем подробностей той истории, но, возможно, этот случай был первым звоночком, предвещающим проблемы с психикой Джона. Тем более что за эту оплошность он лишился привилегий на работе: у него отозвали допуск к секретной информации.
Чуть позже Джон женился на своей студентке Алисии Лард, которая была всего на 4 года его младше. Еще через год журнал Fortune назвал Нэша «восходящей звездой математики», а молодая супруга забеременела. В это же время у него начали проявляться первые признаки шизофрении.
Болезнь развивалась стремительно, и скрывать ее от общественности было все труднее. Последней каплей стало то, как Нэш отверг предложение университета быть деканом математического факультета. Он заявил, что не намерен тратить время на всякие глупости и хочет быть императором Антарктиды.
Джон потерял работу и принудительно был помещен в психиатрическую лечебницу. Ему поставили диагноз «параноидная шизофрения» и два месяца заставляли пить лекарства. После выписки он внезапно решил уехать в Европу. Алисия оставила новорожденного сына родителям и отправилась вслед за мужем. Нэш пытался найти политическое убежище, но не смог. Вскоре он был арестован и депортирован в США.
Отдельно нужно упомянуть визуальные галлюцинации, которые играют большую роль в фильме «Игры разума». Настоящий Нэш никогда их не видел, он только слышал голоса. К тому же у математика была масса необоснованных страхов, которые также не отражены в киноленте. Например, при виде красных галстуков он неизбежно начинал думать, что перед ним стоит участник коммунистического заговора.
Вопреки расхожему мнению, Джон никогда не работал на Пентагон и не искал зашифрованные послания русских или японских шпионов. Правда, он считал, что мир строит заговор против Америки, и поэтому писал правительству США личные письма. Если не вдаваться в детали, Джон убеждал государство, что нужно использовать принципиально иной метод шифровки информации, и даже предложил один. Изумительность идеи заключается в том, что именно этот метод применяется сейчас, в наши дни. Тогда, конечно, никто на письма Джона не отвечал.
Болезнь развивалась. Агрессивное лечение в психбольницах не давало никаких результатов. Джон говорил о себе в третьем лице, постоянно звонил бывшим коллегам, чтобы рассказать об очередной безумной теории заговора, и чего-то боялся.
Когда ситуация окончательно вышла из-под контроля, обезумевшего Нэша снова поместили в клинику. Там он прошел курс инсулинокоматозной терапии — это искусственное введение человека в кому с помощью инсулина. После выписки бывшие коллеги Джона из жалости предложили ему работу, но Нэш отказался и снова уехал в Европу.
Эта поездка стала последней каплей для Алисии. Она развелась с Джоном и вырастила их сына сама. К сожалению, уже в подростковом возрасте стало ясно, что у мальчика тоже шизофрения. По его собственному признанию, он считал, что голоса, которые он слышит, принадлежат Богу. Галлюцинации были не только слуховыми, как у отца, но и визуальными.
Вернувшись из «путешествия», Нэш не без помощи бывших коллег устроился в Принстонский университет и повстречался с новым психиатром, который выписал ему щадящие лекарства, не те, которые приходилось принимать в психлечебницах. Таблетки подавляли проявления шизофрении, и Нэш начал снова общаться с бывшей женой и сыном. Идиллия длилась недолго: Джон боялся, что лекарства влияют на мозг и способность мыслить, и перестал их принимать — симптомы вернулись с новой силой.
В Принстоне Нэш часто бродил по университету как призрак и записывал на меловых досках непонятные формулы. Из-за этого студенты прозвали его Фантомом.
Несмотря на усилившуюся вновь болезнь, Алисия разрешила Нэшу переехать к ним. Она считала, что совершила предательство, когда развелась с Джоном. Возможно, именно этот шаг спас гениального математика от бродяжничества, поскольку, будучи в разводе, он не имел собственного жилья и часто ночевал в отелях или у знакомых.
Болезнь отступила только в 1980-х. Врачи удивленно разводили руками, а весь секрет состоял в том, что Джон усилием ума заставил себя не обращать внимания на симптомы и снова занялся математикой. Препараты он больше не принимал.
Однако есть и ложка дегтя в этой истории: известно, что у шизофреников симптомы ближе к старости становятся все менее явными. Возможно, это был естественный процесс и никакого излечения не произошло.
В 1994 году Нэш получил Нобелевскую премию по экономике за диссертацию, которую написал в 21 год. Традиционную для таких случаев лекцию Джону прочитать не дали, потому что боялись за его психическое состояние. Вместо этого был организован семинар с участием ученых, на котором они обсуждали вклад Джона в теорию игр.
Еще через несколько лет Нэш и Алисия вторично поженились. С момента развода тем временем прошло 38 лет. А незадолго до гибели Нэш получил высшую награду по математике — Абелевскую премию — и стал первым и пока единственным человеком в мире, который удостоился двух премий сразу — Нобелевской и Абелевской.
Джон и Алисия умерли в один день и даже один миг. В 2015 году они попали в автокатастрофу. Ему было 86, Алисии — 82. Интересно, что всему виной была случайность: супруги были не пристегнуты, а водитель автомобиля (был пристегнут) отделался легкой травмой. Как видите, жизнь даже признанного гения может разрушить одна маленькая оплошность.
Источник: adme. ru
Теперь подробнее рассмотрим теорию игр Джона.
В 1930-е годы Джон фон Нейман и Оскар Моргенштерн стали основателями нового интересного направления математики, которое получило название "теория игр". В 1950-е годы этим направлением заинтересовался молодой математик Джон Нэш. Теория равновесия стала темой его диссертации, которую он написал, будучи в возрасте 21 год. Так родилась новая стратегия игр под названием «Равновесие по Нэшу», заслужившая Нобелевскую премию спустя много лет - в 1994 году.
Долгий разрыв между написанием диссертации и всеобщим признанием стал испытанием для математика. Гениальность без признания вылилась в серьезные ментальные нарушения, но и эту задачу Джон Нэш смог решить благодаря прекрасному логическуму разуму. Его теория "равновесие по Нэшу" удостоилась премии Нобеля, а его жизнь экранизации в фильме «Beautiful mind» («Игры разума»).
Поскольку теория равновесия Нэша объясняет поведение людей в условиях взаимодействия, поэтому стоит рассмотреть основные понятия теории игр.
Теория игр изучает поведение участников (агентов) в условиях взаимодействия друг с другом по типу игры, когда исход зависит от решения и поведения нескольких людей. Участник принимает решения, руководствуясь своими прогнозами относительно поведения остальных, что и называется игровой стратегией.
Существует также доминирующая стратегия, при которой участник получает оптимальный результат при любом поведении других участников. Это наилучшая безпроигрышная стратегия игрока.
Дилемма заключенного и научный прорыв
Дилемма заключенного - это случай с игрой, когда участники вынуждены принимать рациональные решения, достигая общей цели в условии конфликта альтернатив. Вопрос заключается в том, какой из этих вариантов он выберет, осознавая личный и общий интерес, а также невозможность получить и то, и другое. Игроки словно заключены в жесткие игровые условия, что порой заставляет их мыслить очень продуктивно.
Эту дилемму исследовал американский математик Джон Нэш. Равновесие, которое он вывел, стало революционным в своем роде. Особенно ярко эта новая мысль повлияла на мнение экономистов о том, как делают выбор игроки рынка, учитывая интересы других, при плотном взаимодействии и пересечении интересов.
Лучше всего изучать теорию игр на конкретных примерах, поскольку сама эта математическая дисциплина не является сухо-теоретической.
Пример дилеммы заключенного
Пример, два человека совершили грабеж, попали в руки полиции и проходят допрос в отдельных камерах. При этом служители полиции предлагают каждому участнику выгодные условия, при которых он выйдет на свободу в случае дачи показаний против своего напарника. У каждого из преступников существует следующий набор стратегий, которые он будет рассматривать:
*Оба одновременно дают показания и получают по 2,5 года в тюрьме.
*Оба одновременно молчат и получают по 1 году, поскольку в таком случае доказательная база их вины будет мала.
*Один дает показания и получает свободу, а другой молчит и получает 5 лет тюрьмы.
Очевидно, что исход дела зависит от решения обоих участников, но сговориться они не могут, поскольку сидят в разных камерах. Также ярко виден конфликт их личных интересов в борьбе за общий интерес. У каждого из заключенных есть два варианта действий и 4 варианта исходов.
Цепь логических умозаключений
Итак, преступник А рассматривает следующие варианты:
*Я молчу и молчит мой напарник — мы оба получим по 1 году тюрьмы.
*Я сдаю напарника и он сдает меня — мы оба получим по 2,5 года тюрьмы.
*Я молчу, а напарник меня сдает — я получу 5 лет тюрьмы, а он свободу.
*Я сдаю напарника, а он молчит – я получаю свободу, а он 5 лет тюрьмы.
Приведем матрицу возможных решений и исходов для наглядности.
Вопрос состоит в том, что выберет каждый участник?
«Молчать, нельзя говорить» или «молчать нельзя, говорить»
Чтобы понять выбор участника, нужно пройти по цепочке его размышлений. Следуя рассуждениям преступника А: если я промолчу и промолчит мой напарник, мы получим минимум срока (1 год), но я не могу узнать, как он себя поведет. Если он даст показания против меня, то мне также лучше дать показания, иначе я могу сесть на 5 лет. Лучше мне сесть на 2,5 года, чем на 5 лет. Если он промолчит, то мне тем более нужно дать показания, поскольку так я получу свободу. Точно так же рассуждает и участник B.
Нетрудно понять, что доминирующая стратегия для каждого из преступников - это дача показаний. Оптимальная точка этой игры наступает тогда, когда оба преступника дают показания и получают свой «приз» — 2,5 года тюрьмы. Теория игр Нэша называет это равновесием.
Неоптимальное оптимальное решение по Нэшу
Революционность нэшевского взгляда в том, что такое равновесие не является оптимальным, если рассмотреть отдельного участника и его личный интерес. Ведь наилучший вариант - это промолчать и выйти на свободу.
Равновесие по Нэшу – это точка соприкосновения интересов, где каждый участник выбирает такой вариант, который для него оптимальный только при условии, что другие участники выбирают определенную стратегию.
Рассматривая вариант, когда оба преступника молчат и получают всего по 1 году, можно назвать него Парето-оптимальным вариантом. Однако он возможен, только если преступники смогли бы сговориться заранее. Но даже это не гарантировало бы этого исхода, поскольку соблазн отступить от уговора и избежать наказания велик. Отсутствие полного доверия друг к другу и опасность получить 5 лет вынуждает выбрать вариант с признанием. Размышлять о том, что участники будут придерживаться варианта с молчанием, действуя согласованно, просто нерационально. Такой вывод можно сделать, если изучать равновесие Нэша. Примеры только доказывают правоту.
Эгоистично или рационально
Теория равновесия Нэша дала потрясающие выводы, опровергнувшие существующие до этого принципы. Например, Адам Смит рассматривал поведение каждого из участников как абсолютно эгоистичное, что и приводило систему в равновесие. Эта теория носила название «невидимая рука рынка».
Джон Нэш увидел, что если все участники будут действовать, преследуя только свои интересы, то это никогда не приведет к оптимальному групповому результату. Учитывая, что рациональное мышление присуще каждому участнику, более вероятен выбор, который предлагает стратегия равновесия Нэша.
Чисто мужской эксперимент
Ярким примером может служить игра «парадокс блондинки», которая хотя и кажется неуместной, но является яркой иллюстрацией, показывающей, как работает теория игр Нэша.
В этой игре нужно представить, что компания свободных парней пришла в бар. Рядом оказывается компания девушек, одна из которых предпочтительнее других, скажем блондинка. Как парням повести себя, чтобы получить наилучшую подругу для себя?
Итак, рассуждения парней: если все начнут знакомиться с блондинкой, то, скорее всего, она никому не достанется, тогда и ее подруги не захотят знакомства. Никто не хочет быть вторым запасным вариантом. Но если парни выберут избегать блондинку, то вероятность каждому из парней найти среди девушек хорошую подругу высока.
Ситуация равновесия по Нэшу неоптимальна для парней, поскольку, преследуя лишь свои эгоистические интересы, каждый выбрал бы именно блондинку. Видно, что преследование только эгоистичных интересов будет равнозначно краху групповых интересов. Равновесие по Нэшу будет значить то, что каждый парень действует в своих личных интересах, которые соприкасаются с интересами всей группы. Это неоптимальный вариант для каждого лично, но оптимальный для каждого, исходя из общей стратегии успеха.
Вся наша жизнь игра
Принятие решений в реальных условиях очень напоминает игру, когда вы ожидаете определенного рационального поведения и от других участников. В бизнесе, в работе, в коллективе, в компании и даже в отношениях с противоположным полом. От больших сделок и до обычных жизненных ситуаций все подчиняется тому или иному закону.
Конечно, рассмотренные игровые ситуации с преступниками и баром - это всего лишь отличные иллюстрации, демонстрирующие равновесие Нэша. Примеры таких дилемм очень часто возникают на реальном рынке, а особенно это работает в случаях с двумя монополистами, контролирующими рынок.
Смешанные стратегии
Часто мы вовлекаемы не в одну, а сразу в несколько игр. Выбирая один из вариантов одной игре, руководствуясь рациональной стратегией, но попадаете в другую игру. После нескольких рациональных решений вы можете обнаружить, что ваш результат вас не устраивает. Что же предпринимать?
Рассмотрим два вида стратегии:
Чистая стратегия – это поведение участника, которое исходит из размышления над возможным поведением других участников.
Смешанная стратегия или случайная стратегия – это чередование чистых стратегий случайным образом или выбор чистой стратегии с определенной вероятностью. Такую стратегию еще называют рэндомизированной.
Рассматривая такое поведение, мы получаем новый взгляд на равновесие по Нешу. Если ранее говорилось о том, что игрок выбирает стратегию один раз, то можно представить и другое поведение. Можно допустить тот вариант, что игроки выбирают стратегию случайно с определенной вероятностью. Игры, в которых нельзя найти равновесия Нэша в чистых стратегиях, всегда имеют их в смешанных.
Равновесие Нэша в смешанных стратегиях называется смешанным равновесием. Это такое равновесие, где каждый участник выбирает оптимальную частоту выбора своих стратегий при условии, что другие участники выбирают свои стратегии с заданной частотой.
Пенальти и смешанная стратегия
Пример смешанной стратегии можно привести в игре в футбол. Лучшая иллюстрация смешанной стратегии - это, пожалуй, серия пенальти. Так, у нас есть вратарь, который может прыгнуть только в один угол, и игрок, который будет бить пенальти.
Итак, если в первый раз игрок выберет стратегию сделать удар в левый угол, а вратарь также упадет в этот угол и словит мяч, то как могут развиваться события во второй раз? Если игрок будет бить в противоположный угол, это, скорее всего, слишком очевидно, но и удар в тот же угол не менее очевиден. Поэтому и вратарю, и бьющему ничего не остается, как положиться на случайный выбор.
Так, чередуя случайный выбор с определенной чистой стратегией, игрок и вратарь пытаються получить максимальный результат.
Источник: fb. ru
«Энергия науки»: теория игр вокруг нас
Известный популяризатор науки Алексей Савватеев представил в Ульяновске лекцию «Теория игр вокруг нас» в рамках проекта сети Информационных центров по атомной энергии (ИЦАЭ) «Энергия науки» 16 апреля.
По словам лектора, теория игр – это наука о том, как предсказывать действия противников или соперников. Её главный лейтмотив – думай за других.
Слушатели узнали, как применять теорию игр в жизни. Алексей Владимирович вместе с аудиторией смоделировал «игру» и разобрал её на сюжеты, в том числе рассказал, как выглядят математические равновесия.
Эксперт объяснил, почему поезд из Великого Новгорода едет не в Москву, а в Нижний Новгород, рассказал, когда начинается шабат за полярным кругом и в чем заключается транспортный парадокс Брайеса. Самым интересным стал анализ прошедшего в России в 2018 году Чемпионат мира по футболу с точки зрения математики.
«Энергия науки» – федеральный проект сети информационных центров по атомной энергии, в рамках которого ведущие российские ученые и журналисты знакомят жителей страны всех возрастов с последними научными открытиями и достижениями во многих областях знаний.
Конкурс для мемоделов: с вас мем — с нас приз
Конкурс мемов объявляется открытым!
Выкручивайте остроумие на максимум и придумайте надпись для стикера из шаблонов ниже. Лучшие идеи войдут в стикерпак, а их авторы получат полугодовую подписку на сервис «Пакет».
Кто сделал и отправил мемас на конкурс — молодец! Результаты конкурса мы объявим уже 3 мая, поделимся лучшими шутками по мнению жюри и ссылкой на стикерпак в телеграме. Полные правила конкурса.
А пока предлагаем посмотреть видео, из которых мы сделали шаблоны для мемов. В главной роли Валентин Выгодный и «Пакет» от Х5 — сервис для выгодных покупок в «Пятёрочке» и «Перекрёстке».
Реклама ООО «Корпоративный центр ИКС 5», ИНН: 7728632689