Главная - Эмоции
Методы принятия решения. Платежная матрица

Хотя некоторые модели, используемые в производственном менеджменте, настолько сложны, что без компьютера обойтись невозможно, концепция моделирования проста.

По определению Шеннона: «МОДЕЛЬ - это представление объекта, системы или идеи в некоторой форме, отличной от самой целостности». Схема организации, к примеру, это и есть модель, представляющая ее структуру.

Главной характеристикой модели можно считать упрощение реальной жизненной ситуации, к которой она применяется. Поскольку форма модели менее сложна, а не относящиеся к делу данные, затуманивающие проблему в реальной жизни, устраняются, модель зачастую повышает способность руководителя к пониманию и разрешению встающих перед ним проблем.

Число всевозможных конкретных моделей науки управления почти так же велико, как и число проблем, для разрешения которых они были разработаны.

Практически любой метод принятия решений, используемый в управлении, можно технически рассматривать как разновидность моделирования. В дополнение к моделированию, имеется ряд методов, способных оказать помощь руководителю в поиске объективно обоснованного решения по выбору из нескольких альтернатив той, которая в наибольшей мере способствует достижению целей. К таким относится Платежная матрица.

Суть каждого принимаемого руководством решения - выбор наилучшей из нескольких альтернатив по конкретным установленным заранее критериям.

Платежная матрица - это один из методов статистической теории решений, метод, который может оказать помощь руководителю в выборе одного из нескольких вариантов. Он особенно полезен, когда руководитель должен установить, какая стратегия в наибольшей мере будет способствовать достижению целей.

По словам Н. Пола Лумбы: «Платеж представляет собой денежное вознаграждение или полезность, являющиеся следствием конкретной стратегии в сочетании с конкретными обстоятельствами. Если платежи представить в форме таблицы (или матрицы), мы получаем платежную матрицу», как показано в таблице 1.

В самом общем виде матрица означает, что платеж зависит от определенных событий, которые фактически свершаются. Если такое событие или состояние природы не случается на деле, платеж неизбежно будет иным.

Таблица 1. Платежная матрица

В целом платежная матрица полезна, когда:

Имеется разумно ограниченное число альтернатив или вариантов стратегии для выбора между ними.

То, что может случиться, с полной определенностью не известно.

Результаты принятого решения зависят от того, какая именно выбрана альтернатива и какие события в действительности имеют место.

Кроме того, руководитель должен располагать возможностью объективной оценки вероятности релевантных событий и расчета ожидаемого значения такой вероятности. Руководитель редко имеет полную определенность. Но также редко он действует в условиях полной неопределенности. Почти во всех случаях принятия решений руководителю приходится оценивать вероятность или возможность события. Из предшествующего рассмотрения напомним, что вероятность варьирует от 1, когда событие определенно произойдет, до 0, когда событие определенно не произойдет. Вероятность можно определить объективно, как поступает игрок в рулетку, ставя на нечетные номера. Выбор ее значения может опираться на прошлые тенденции или субъективную оценку руководителя, который исходит из собственного опыта действий в подобных ситуациях.

Суть каждого принимаемого руководством решения - выбор наилучшей из нескольких альтернатив по конкретным установленным заранее критериям. Платежная матрица - это один из методов статистической теории решений, метод, который может оказать помощь руководителю в выборе одного из нескольких вариантов. Он особенно полезен, когда руководитель должен установить, какая стратегия в наибольшей мере будет способствовать достижению целей.

По словам Н. Пола Лумбы: «Платеж представляет собой денежное вознаграждение или полезность, являющиеся следствием конкретной стратегии в сочетании с конкретными обстоятельствами. Если платежи представить в форме таблицы (или матрицы), мы получаем платежную матрицу», как показано на рис. 8.4. Слова «в сочетании с конкретными обстоятельствами» очень важны, чтобы понять, когда можно использовать платежную матрицу и оценить, когда решение, принятое на ее основе, скорее всего будет надежным. В самом общем виде матрица означает, что платеж зависит от определенных событий, которые фактически свершаются. Если такое событие или состояние природы не случается на деле, платеж неизбежно будет иным.

В целом платежная матрица полезна, когда:

1. Имеется разумно ограниченное число альтернатив или вариантов стратегии для выбора между ними.

2. То, что может случиться, с полной определенностью не известно.

3. Результаты принятого решения зависят от того, какая именно выбрана альтернатива и какие события в действительности имеют место.

Кроме того, руководитель должен располагать возможностью объективной оценки вероятности релевантных событий и расчета ожидаемого значения такой вероятности. Руководитель редко имеет полную определенность. Но также редко он действует в условиях полной неопределенности. Почти во всех случаях принятия решений руководителю приходится оценивать вероятность или возможность события. Из предшествующего рассмотрения напомним, что вероятность варьирует от 1, когда событие определенно произойдет, до 0, когда событие определенно не произойдет. Вероятность можно определить объективно, как поступает игрок в рулетку, ставя на нечетные номера. Выбор ее значения может опираться на прошлые тенденции или субъективную оценку руководителя, который исходит из собственного опыта действий в подобных ситуациях.

Рис.4. Платежная матрица

Представим ситуацию торгового агента, который решает, лететь ему самолетом или ехать поездом за город, где находится потребитель. Если погода будет хорошей, он может лететь и потратить на всю дорогу от ворот до ворот 2 ч, а если придется ехать поездом - 7 ч. Если он поедет поездом, то потеряет день на месте его работы, который, по его оценке, мог бы увеличить сбыт на 1500 долл. По оценке иногородний потребитель должен вручить ему заказ на 3000 долл., если он лично посетит клиента. Если он запланирует лететь к клиенту, в потом самолет вынужден будет приземлиться из-за тумана, придется заменить личное посещение телефонным звонком. Это приведет к уменьшению заказа иногороднего клиента до 500 долл., зато агент сможет обеспечить заказы на 1500 долл. дома.



Приведенные выше данные платежной матрицы отражают оценку последствий разных вариантов действий. Дополнительно представлены некоторые предположения относительно вероятности тумана (который скажется на самолете, но не на поезде) и ясной погоды. Мы видим, что вероятность ясной погоды в 10 раз выше, чем тумана. Далее, матрица показывает, что, действуя по первому варианту стратегии (самолет), если погода будет хорошей (9 шансов из 10), торговый агент по оценке продаст товаров на 4500 долл. (это и есть результат или последствия). Три других варианта последствий можно объяснить таким же образом, мы опускаем эти рассуждения.

Если вероятность не была принята в расчет, решение всегда будет соскальзывать в направлении наиболее оптимистических последствий. Например, если исходить из того, что инвесторы на удачной кинокартине могут иметь 500% на инвестированный капитал, а при вложении в торговую сеть - в самом благоприятном варианте всего 20%, то решение всегда должно быть в пользу кинопроизводства. Однако если взять в расчет, что вероятность большого успеха кинофильма весьма невысока, капиталовложения в магазины становятся более привлекательными, поскольку вероятность получения указанных 20% очень значительна. Если взять более простой пример, то выплаты при ставках в заезде на длинную дистанцию на скачках выше, поскольку выше вероятность, что не выиграешь вообще ничего.

Вероятность прямо влияет на определение ожидаемого значения - центральной концепции платежной матрицы. Ожидаемое значение альтернативы или варианта стратегии - это сумма возможных значений, умноженных на соответствующие вероятности. К примеру, если вы считаете, что вложение средств (как стратегия действий) в киоск для торговли мороженым с вероятностью 0,5 обеспечит вам годовую прибыль 5000 долл., с вероятностью 0,2 - 10 000 долл. и с вероятностью 0,3 - 3000 долл., то ожидаемое значение составит:

5000 (0,5) + 10 000 (0,2) + 3000 (0,3) = 5400 долл.

Определив ожидаемое значение каждой альтернативы и расположив результаты в виде матрицы, руководитель без труда может установить, какой выбор наиболее привлекателен при заданных критериях. Он будет, конечно, соответствовать наивысшему ожидаемому значению. Исследования показывают: когда установлены точные значения вероятности, методы дерева решений и платежной матрицы обеспечивают принятие более качественных решений, чем традиционные подходы.

Хотя некоторые модели, используемые в производственном менеджменте, настолько сложны, что без компьютера обойтись невозможно, концепция моделирования проста.

По определению Шеннона: «МОДЕЛЬ - это представление объекта, системы или идеи в некоторой форме, отличной от самой целостности». Схема организации, к примеру, это и есть модель, представляющая ее структуру.

Главной характеристикой модели можно считать упрощение реальной жизненной ситуации, к которой она применяется. Поскольку форма модели менее сложна, а не относящиеся к делу данные, затуманивающие проблему в реальной жизни, устраняются, модель зачастую повышает способность руководителя к пониманию и разрешению встающих перед ним проблем.

Число всевозможных конкретных моделей науки управления почти так же велико, как и число проблем, для разрешения которых они были разработаны.

Практически любой метод принятия решений, используемый в управлении, можно технически рассматривать как разновидность моделирования. В дополнение к моделированию, имеется ряд методов, способных оказать помощь руководителю в поиске объективно обоснованного решения по выбору из нескольких альтернатив той, которая в наибольшей мере способствует достижению целей. К таким относится Платежная матрица.

Суть каждого принимаемого руководством решения - выбор наилучшей из нескольких альтернатив по конкретным установленным заранее критериям.

Платежная матрица - это один из методов статистической теории решений, метод, который может оказать помощь руководителю в выборе одного из нескольких вариантов. Он особенно полезен, когда руководитель должен установить, какая стратегия в наибольшей мере будет способствовать достижению целей.

По словам Н. Пола Лумбы: «Платеж представляет собой денежное вознаграждение или полезность, являющиеся следствием конкретной стратегии в сочетании с конкретными обстоятельствами. Если платежи представить в форме таблицы (или матрицы), мы получаем платежную матрицу», как показано в таблице 1.

В самом общем виде матрица означает, что платеж зависит от определенных событий, которые фактически свершаются. Если такое событие или состояние природы не случается на деле, платеж неизбежно будет иным Мескон Майкл, Альберт Майкл, Хедоури Франклин. Основы менеджмента./ Перевод с английского. - М.:Издательство «Дело», 1997. - http://www.tourlib.columb.net.ua/Lib/meskon.htm.

Таблица 1. Платежная матрица

В целом платежная матрица полезна, когда:

1. Имеется разумно ограниченное число альтернатив или вариантов стратегии для выбора между ними.

2. То, что может случиться, с полной определенностью не известно.

3. Результаты принятого решения зависят от того, какая именно выбрана альтернатива и какие события в действительности имеют место.

Кроме того, руководитель должен располагать возможностью объективной оценки вероятности релевантных событий и расчета ожидаемого значения такой вероятности. Руководитель редко имеет полную определенность. Но также редко он действует в условиях полной неопределенности. Почти во всех случаях принятия решений руководителю приходится оценивать вероятность или возможность события. Из предшествующего рассмотрения напомним, что вероятность варьирует от 1, когда событие определенно произойдет, до 0, когда событие определенно не произойдет. Вероятность можно определить объективно, как поступает игрок в рулетку, ставя на нечетные номера. Выбор ее значения может опираться на прошлые тенденции или субъективную оценку руководителя, который исходит из собственного опыта действий в подобных ситуациях.

Если вероятность не была принята в расчет, решение всегда будет соскальзывать в направлении наиболее оптимистических последствий.

Например, если исходить из того, что инвесторы на удачной кинокартине могут иметь 500% на инвестированный капитал, а при вложении в торговую сеть - в самом благоприятном варианте всего 20%, то решение всегда должно быть в пользу кинопроизводства. Однако если взять в расчет, что вероятность большого успеха кинофильма весьма невысока, капиталовложения в магазины становятся более привлекательными, поскольку вероятность получения указанных 20% очень значительна. Если взять более простой пример, то выплаты при ставках в заезде на длинную дистанцию на скачках выше, поскольку выше вероятность, что не выиграешь вообще ничего Мескон Майкл, Альберт Майкл, Хедоури Франклин. Основы менеджмента./ Перевод с английского. - М.:Издательство «Дело», 1997. - http://www.tourlib.columb.net.ua/Lib/meskon.htm.

Вероятность прямо влияет на определение ожидаемого значения - центральной концепции платежной матрицы. Ожидаемое значение альтернативы или варианта стратегии - это сумма возможных значений, умноженных на соответствующие вероятности.

Определив ожидаемое значение каждой альтернативы и расположив результаты в виде матрицы, руководитель без труда может установить, какой выбор наиболее привлекателен при заданных критериях. Он будет, конечно, соответствовать наивысшему ожидаемому значению (Таблица 2).

На основе платежной матрицы З = ||З ji || рассчитывается матрица рисков - =|| ji || . При этом риск ji для варианта деятельности x j и сочетания исходных данных определяется по формуле

Таблица 2. Платежная матрица З = ||З ji ||

Варианты деятельности

Сочетания исходных данных

Платежная матрица рисков служит информационной основой для сопоставления и выбора окончательного (предпочтительного) с точки зрения оптимальности варианта деятельности. Для осуществления такого выбора используются специальные правила принятия решения в условиях неопределенности и риска. К числу таких правил относятся:

1. Критерий Лапласа (минимумы среднеарифметических затрат З j).

2. Критерий Вальда (минимальных затрат или максимальной полезности).

3. Критерий Сэвиджа (минимального риска).

4. Критерий Гурвица.

1. Критерий Лапласа. По принципу недостаточного основания в условиях, когда невозможно выяснить вероятности для возникновения того или иного состояния внешней среды, им сопоставляют равные вероятности, находят средний эффект для каждого из рассматриваемых вариантов решения и выбирается тот из них, где средний эффект максимален:

2. Критерий Вальда (критерий наибольшей осторожности/ пессимиста). Для каждого из рассматриваемых вариантов решения Xi выбирается самая худшая ситуация (наименьшее из Wij) и среди них отыскивается гарантированный максимальный эффект:

3. Критерий Гурвица. Ориентация на самый худший исход является своеобразной перестраховкой, однако опрометчиво выбирать и излишне оптимистичную политику. Критерий Гурвица предлагает некоторый компромисс:

где параметр б принимает значение от 0 до 1 и выступает как коэффициент оптимизма.

К примеру, при б =0 (полный пессимизм) критерий Гурвица превращается в критерий Вальда, при б =0.5 расценивают равновероятно шансы на успех и неудачу, при б =0.2 - более осторожны и вероятность успеха считают меньшей (0.2), чем возможную неудачу.

4. Критерий Сэвиджа. Суть его - нахождение минимального риска. При выборе решения по этому критерию:

Dij = Wij- (Wij)

· матрице функции полезности (эффективности) сопоставляется новая матрица - матрица сожалений, элементы которой отражают убытки от ошибочного действия, т.е. выгоду, упущенную в результате принятия i>-го решения в j-м состоянии;

· по матрице D выбирается решение по пессимистическому критерию Вальда, дающее наименьшее значение максимального сожаления

Вполне логично, что различные критерии приводят к различным выводам относительно наилучшего решения. Вместе с тем возможность выбора критерия дает свободу менеджерам, принимающим управленческие решения.

Любой критерий должен согласовываться с намерениями решающего задачу и соответствовать его характеру, знаниям и убеждениям М.А.Тынкевич. Экономико-математические методы (исследование операций). - Кемерово: КузГТУ, 2000..

Имеются и другие обобщенные критерии, являющиеся по существу комбинациями выше перечисленных критериев). Однако ни один из них не свободен от условностей и не обеспечивает однозначного выбора варианта деятельности. Поэтому окончательный выбор варианта - задача экспертов и специалистов.

2.2 Примеры матричных игр в чистой и смешанной стратегиях Уменьшение порядка платёжной матрицы

Порядок платёжной матрицы (количество строк и столбцов) может быть уменьшен за счёт исключения доминируемых и дублирующих стратегий.

Стратегия K* называется доминируемой стратегией K**, если при любом варианте поведения противодействующего игрока выполняется соотношение

где и - значения выигрышей при выборе игроком, соответственно, стратегий K* и K**.

В случае, если выполняется соотношение

стратегия K* называется дублирующей по отношению к стратегии K**.

Например, в матрице

B1 B2 B3 B4 B5 B6
A1 1 2 3 4 4 7
A2 7 6 5 4 4 8
A3 1 8 2 3 3 6
A4 8 1 3 2 2 5

Платёжная матрица с доминируемыми и дублирующими стратегиями. Стратегия A1 является доминируемой по отношению к стратегии A2, стратегия B6 является доминируемой по отношению к стратегиям B3, B4 и B5, а стратегия B5 является дублирующей по отношению к стратегии B4. Данные стратегии не будут выбраны игроками, так как являются заведомо проигрышными и удаление этих стратегий из платёжной матрицы не повлияет на определение нижней и верхней цены игры, описанной данной матрицей.

Множество недоминируемых стратегий, полученных после уменьшения размерности платёжной матрицы, называется ещё множеством Парето (по имени итальянского экономиста Вильфредо Парето, занимавшегося исследованиями в данной области)

Пример решения матричной игры в чистых стратегиях

Рассмотрим пример решения матричной игры в чистых стратегиях, в условиях реальной экономики, в ситуации борьбы двух предприятий за рынок продукции региона.

Два предприятия производят продукцию и поставляют её на рынок региона. Они являются единственными поставщиками продукции в регион, поэтому полностью определяют рынок данной продукции в регионе.

Каждое из предприятий имеет возможность производить продукцию с применением одной из трёх различных технологий. В зависимости от качества продукции, произведённой по каждой технологии, предприятия могут установить цену единицы продукции на уровне 10, 6 и 2 денежных единиц соответственно. При этом предприятия имеют различные затраты на производство единицы продукции.

Затраты на единицу продукции, произведенной на предприятиях региона (д.е.).

Технология Цена реализации единицы продукции, д.е. Полная себестоимость единицы продукции, д.е.
Предприятие 1 Предприятие 2
I 10 5 8
II 6 3 4
III 2 1.5 1

В результате маркетингового исследования рынка продукции региона была определена функция спроса на продукцию:

Y = 6 – 0.5×X,


где Y – количество продукции, которое приобретёт население региона (тыс. ед.), а X – средняя цена продукции предприятий, д.е.

Данные о спросе на продукцию в зависимости от цен реализации приведены в таблице.

Спрос на продукцию в регионе, тыс. ед.

Средняя цена реализации 1 ед. продукции, д.е. Спрос на продукцию, тыс. ед.
Предприятие 1 Предприятие 2
10 10 10 1
10 6 8 2
10 2 6 3
6 10 8 2
6 6 6 3
6 2 4 4
2 10 6 3
2 6 4 4
2 2 2 5

Значения долей продукции предприятия 1, приобретенной населением, зависят от соотношения цен на продукцию предприятия 1 и предприятия 2. В результате маркетингового исследования эта зависимость установлена и значения вычислены.

Доля продукции предприятия 1, приобретаемой населением в зависимости от соотношения цен на продукцию (табл. 1.1)

Цена реализации 1 ед. продукции, д.е.
Предприятие 1 Предприятие 2
10 10 0,31
10 6 0,33
10 2 0,18
6 10 0,7
6 6 0,3
6 2 0,2
2 10 0,92
2 6 0,85
2 2 0,72

По условию задачи на рынке региона действует только 2 предприятия. Поэтому долю продукции второго предприятия, приобретённой населением, в зависимости от соотношения цен на продукцию можно определить как единица минус доля первого предприятия.

Стратегиями предприятий в данной задаче являются их решения относительно технологий производства продукции. Эти решения определяют себестоимость и цену реализации единицы продукции. В задаче необходимо определить:

1. Существует ли в данной задаче ситуация равновесия при выборе технологий производства продукции обоими предприятиями?

2. Существуют ли технологии, которые предприятия заведомо не будут выбирать вследствие невыгодности?

3. Сколько продукции будет реализовано в ситуации равновесия? Какое предприятие окажется в выигрышном положении?

Решение задачи

1. Определим экономический смысл коэффициентов выигрышей в платёжной матрице задачи. Каждое предприятие стремится к максимизации прибыли от производства продукции. Но кроме того, в данном случае предприятия ведут борьбу за рынок продукции в регионе. При этом выигрыш одного предприятия означает проигрыш другого. Такая задача может быть сведена к матричной игре с нулевой суммой. При этом коэффициентами выигрышей будут значения разницы прибыли предприятия 1 и предприятия 2 от производства продукции. В случае, если эта разница положительна, выигрывает предприятие 1, а в случае, если она отрицательна – предприятие2.

2. Рассчитаем коэффициенты выигрышей платёжной матрицы. Для этого необходимо определить значения прибыли предприятия 1 и предприятия 2 от производства продукции. Прибыль предприятия в данной задаче зависит:

От цены и себестоимости продукции;

От количества продукции, приобретаемой населением региона;

От доли продукции, приобретённой населением у предприятия.

Таким образом, значения разницы прибыли предприятий, соответствующие коэффициентам платёжной матрицы, необходимо определить по формуле (1):

D = p×(S×R1-S×C1) – (1-p) ×(S×R2-S×C2) (1),

где D – значение разницы прибыли от производства продукции предприятия 1 и предприятия 2;

p - доля продукции предприятия 1, приобретаемой населением региона;

S – количество продукции, приобретаемой населением региона;

R1 и R2 - цены реализации единицы продукции предприятиями 1 и 2;

C1 и C2 – полная себестоимость единицы продукции, произведённой на предприятиях 1 и 2.

Вычислим один из коэффициентов платёжной матрицы.

Пусть, например, предприятие 1 принимает решение о производстве продукции в соответствии с технологией III, а предприятие 2 – в соответствии с технологией II. Тогда цена реализации единицы. продукции для предприятия 1 составит 2 д.е. при себестоимости единицы. продукции 1,5 д.е. Для предприятия 2 цена реализации единицы. продукции составит 6 д.е. при себестоимости 4 д.е. (табл. 1.1).

Количество продукции, которое население региона приобретёт при средней цене 4 д.е., равно 4 тыс. ед. (таблица 1.2). Доля продукции, которую население приобретёт у предприятия 1, составит 0,85, а у предприятия 2 – 0,15 (табл. 1.3). Вычислим коэффициент платёжной матрицы a 32 по формуле (1): a 32 = 0,85×(4×2-4×1,5) – 0,15×(4×6-4×4) = 0,5 тыс. ед.

где i=3 – номер технологии первого предприятия, а j=2 – номер технологии второго предприятия.

Аналогично вычислим все коэффициенты платёжной матрицы. В платёжной матрице стратегии A1 – A3 – представляют собой решения о технологиях производства продукции предприятием 1, стратегии B1 – B3 – решения о технологиях производства продукции предприятием 2, коэффициенты выигрышей – разницу прибыли предприятия 1 и предприятия 2. Платёжная матрица в игре «Борьба двух предприятий за рынок продукции региона».

B1 B2 B3
A1 0,17 0,62 0,24 0.17
A2 3 -1,5 -0,8 -1.5
A3 0,9 0,5 0,4 0.4
3 0.62 0.4

В данной матрице нет ни доминируемых, ни дублирующих стратегий. Это значит, что для обоих предприятий нет заведомо невыгодных технологий производства продукции. Определим минимальные элементы строк матрицы. Для предприятия 1 каждый из этих элементов имеет значение минимально гарантированного выигрыша при выборе соответствующей стратегии. Минимальные элементы матрицы по строкам имеют значения: 0,17, -1,5, 0,4.

Определим максимальные элементы столбцов матрицы. Для предприятия 2 каждый из этих элементов также имеет значение минимально гарантированного выигрыша при выборе соответствующей стратегии. Максимальные элементы матрицы по столбцам имеют значения: 3, 0,62, 0,4.

Нижняя цена игры в матрице равна 0,4. Верхняя цена игры также равна 0,4. Таким образом, нижняя и верхняя цена игры в матрице совпадают. Это значит, что имеется технология производства продукции, которая является оптимальной для обоих предприятий в условиях данной задачи. Эта технология III, которая соответствует стратегиям A3 предприятия 1 и B3 предприятия 2. Стратегии A3 и B3 – чистые оптимальные стратегии в данной задаче.

Значение разницы прибыли предприятия 1 и предприятия 2 при выборе чистой оптимальной стратегии положительно. Это означает, что предприятие 1 выиграет в данной игре. Выигрыш предприятия 1 составит 0,4 тыс. д.е. При этом на рынке будет реализовано 5 тыс. ед. продукции (реализация равна спросу на продукцию, таблица 1.2).. Оба предприятия установят цену за единицу продукции в 2 д.е. При этом для первого предприятия полная себестоимость единицы продукции составит 1,5 д.е., а для второго – 1 д.е (таблица 1.1). Предприятие 1 окажется в выигрыше лишь за счёт высокой доли продукции, которую приобретёт у него население.

Смешанные стратегии в матричных играх

Понятие о матричных играх со смешанным расширением

Исследование в матричных играх начинается с нахождения её чистой цены. Если матричная игра имеет решение в чистых стратегиях, то нахождением чистой цены заканчивается исследование игры. Если же в игре нет решения в чистых стратегиях, то можно найти нижнюю и верхнюю цены этой игры, которые указывают, что игрок 1 не должен надеяться на выигрыш больший, чем верхняя цена игры, и может быть уверен в получении выигрыша не меньше нижней цены игры. Улучшение решений матричных игр следует искать в использовании секретности применения чистых стратегий и возможности многократного повторения игр в виде партии. Этот результат достигается путём применения чистых стратегий случайно, с определённой вероятностью.

Определение. Смешанной стратегией игрока называется полный набор чистых стратегий, применённых в соответствии с установленным распределением вероятностей. Матричная игра, решаемая с использованием смешанных стратегий, называется игрой со смешанным расширением.

Стратегии, применённые с вероятностью, отличной от нуля, называются активными стратегиями.

Доказано, что для всех игр со смешанным расширением существует оптимальная смешанная стратегия, значение выигрыша при выборе которой находится в интервале между нижней и верхней ценой игры:

Vн £ V £ Vв.

При этом условии величина V называется ценой игры.

Кроме того, доказано, что, если один из игроков придерживается своей оптимальной смешанной стратегии, то выигрыш остаётся неизменным и равным цене игры V, независимо от того, каких стратегий придерживается другой игрок, если только он не выходит за пределы своих активных стратегий. Поэтому, для достижения наибольшего гарантированного выигрыша второму игроку также необходимо придерживаться своей оптимальной смешанной стратегии.

Решение матричных игр со смешанным расширением методами линейного программирования

Решение матричной игры со смешанным расширением – это определение оптимальных смешанных стратегий, то есть нахождение таких значений вероятностей выбора чистых стратегий для обоих игроков, при которых они достигают наибольшего выигрыша.

Для матричной игры, платёжная матрица которой показана на рис. 1.1, V н ¹ V в, определим такие значения вероятностей выбора стратегий для игрока 1 (p 1 , p 2 ,…, p m) и для игрока 2 (q 1 , q 2 ,…, q n), при которых игроки достигали бы своего максимально гарантированного выигрыша.

Если один из игроков придерживается своей оптимальной стратегии, то, по условию задачи, его выигрыш не может быть меньше цены игры V. Поэтому данная задача может быть представлена для игроков в виде следующих систем линейных неравенств:

Для первого игрока:


Для второго игрока:

Чтобы определить значение V, разделим обе части каждого из уравнений на V. Величину p i /V обозначим через x i , а q j /V – через y j .

Для игрока 1 получим следующую систему неравенств, из которой найдём значение 1/v:

Для игрока 1 необходимо найти максимальную цену игры (V). Следовательно, значение 1/V должно стремиться к минимуму.

min Z = min 1/V = min (x 1 + x 2 + … + x m)


Для игрока 2 получим следующую систему неравенств, из которой найдём значение 1/v:

Для игрока 2 необходимо найти минимальную цену игры (V). Следовательно, значение 1/V должно стремиться к максимуму.

Целевая функция задачи будет иметь следующий вид:

Все переменные в данных системах линейных неравенств должны быть неотрицательными: x i = p i /V, а y i = q j /V. Значения p i и q j не могут быть отрицательными, так как являются значениями вероятностей выбора стратегий игроков. Поэтому необходимо, чтобы значение цены игры V не было отрицательным. Цена игры вычисляется на основе коэффициентов выигрышей платёжной матрицы. Поэтому, для того, чтобы гарантировать условие неотрицательности для всех переменных, необходимо, чтобы все коэффициенты матрицы были неотрицательными. Этого можно добиться, прибавив перед началом решения задачи к каждому коэффициенту матрицы число K, соответствующее модулю наименьшего отрицательного коэффициента матрицы. Тогда в ходе решения задачи будет определена не цена игры, а величина


Для решения задач линейного программирования используется симплекс-метод. .

В результате решения определяются значения целевых функций (для обоих игроков эти значения совпадают), а также значения переменных x i и y j .

Величина V* определяется по формуле: V* = 1/z

Значения вероятностей выбора стратегий определяются: для игрока 1: P i = x i ×V*: для игрока 2: q i = y i ×V*.

Для определения цены игры V из величины V* необходимо вычесть число K.

Пример решения матричной игры со смешанным расширением

Рассмотрим пример решения матричной игры со смешанным расширением. Платёжную матрицу игры составим на основе исходных данных, заменив лишь значения долей продукции предприятия 1, приобретаемой населением в зависимости от соотношений цен (табл. 2.1).

Таблица 2.1 - Доля продукции предприятия 1, приобретаемой населением в зависимости от соотношения цен на продукцию

Цена реализации 1 ед. продукции, д.е. Доля продукции предприятия 1, купленной населением
Предп. 1 Предп. 2
10 10 0,31
10 6 0,33
10 2 0,18
6 10 0,7
6 6 0,3
6 2 0,2
2 10 0,9
2 6 0,85
2 2 0,69

Применив к исходным данным задачи формулу (1) определения разницы прибыли от производства продукции, получим следующую платёжную матрицу

Платёжная матрица в игре «Борьба двух предприятий за рынок продукции региона»

B1 B2 B3
A1 0,17 0,62 0,24 0.17
A2 3 -1,5 -0,8 -1.5
A3 0,75 0,5 0,175 0,175
3 0.62 0.24

В данной матрице нет доминируемых или дублирующих стратегий. Нижняя цена игры равна 0,175, а верхняя цена игры равна 0,24. Нижняя цена игры не равна верхней. Поэтому решения в чистых стратегиях не существует и для каждого из игроков необходимо найти оптимальную смешанную стратегию.

Решение задачи

1. В данной матрице имеются отрицательные коэффициенты. Для соблюдения условия неотрицательности в задачах линейного программирования прибавим к каждому коэффициенту матрицы модуль минимального отрицательного коэффициента. В данной задаче к каждому коэффициенту матрицы необходимо прибавить число 1,5 – значение модуля наименьшего отрицательного элемента матрицы. Получим платёжную матрицу, преобразованную для выполнения условия неотрицательности

Платёжная матрица, преобразованная для выполнения условия неотрицательности

B1 B2 B3
A1 1,67 2,12 1,74
A2 4,5 0 0,7
A3 2,25 2 1,675

Общую цель. Однако разные члены коллектива могут быть по-разному информированы об обстановке проведения игры. Выигрыш или проигрыш сторон оценивается численно, другие случаи в теории игр не рассматриваются, хотя не всякий выигрыш в действительности можно оценить количественно. Игрок - одна из сторон в игровой ситуации. Стратегия игрока - его правила действия в каждой из возможных ситуаций игры. ...

Суть каждого принимаемого руководством решения - выбор наилучшей из нескольких альтернатив по конкретным установленным заранее критериям. (В случае если вы захотите вспомнить рассмотрение ограничений и критериев для принятия решений, обратитесь к гл. 6).Платежная матрица - это один из методов статистической теории решений, метод, который может оказать помощь руководителю в выборе одного из нескольких вариантов. Он особенно полезен, когда руководитель должен установить, какая стратегия в наибольшей мере будет способствовать достижению целœей.

По словам Н. Пола Лумбы: ʼʼПлатеж представляет собой денежное вознаграждение или полезность, являющиеся следствием конкретной стратегии в сочетании с конкретными обстоятельствами. В случае если платежи представить в форме таблицы (или матрицы), мы получаем платежную матрицуʼʼ, как показано на рис. 8.4. Слова ʼʼв сочетании с конкретными обстоятельствамиʼʼ очень важны, чтобы понять, когда можно использовать платежную матрицу и оценить, когда решение, принятое на ее основе, скорее всœего будет надежным. В самом общем виде матрица означает, что платеж зависит от определœенных событий, которые фактически свершаются. В случае если такое событие или состояние природы не случается на делœе, платеж неизбежно будет иным.

В целом платежная матрица полезна, когда:

1. Имеется разумно ограниченное число альтернатив или вариантов стратегии для выбора между ними.

2. То, что может случиться, с полной определœенностью не известно.

3. Результаты принятого решения зависят от того, какая именно выбрана альтернатива и какие события в действительности имеют место.

Вместе с тем, руководитель должен располагать возможностью объективной оценки вероятности релœевантных событий и расчета ожидаемого значения такой вероятности. Руководитель редко имеет полную определœенность. Но также редко он действует в условиях полной неопределœенности. Почти во всœех случаях принятия решений руководителю приходится оценивать вероятность или возможность события. Из предшествующего рассмотрения напомним, что вероятность варьирует от 1, когда событие определœенно произойдет, до 0, когда событие определœенно не произойдет. Вероятность можно определить объективно, как поступает игрок в рулетку, ставя на нечетные номера. Выбор ее значения может опираться на прошлые тенденции или субъективную оценку руководителя, который исходит из собственного опыта действий в подобных ситуациях.

В случае если вероятность не была принята в расчет, решение всœегда будет соскальзывать в направлении наиболее оптимистических последствий. К примеру, в случае если исходить из того, что инвесторы на удачной кинокартинœе могут иметь 500% на инвестированный капитал, а при вложении в торговую сеть - в самом благоприятном варианте всœего 20%, то решение всœегда должно быть в пользу кинопроизводства. При этом если взять в расчет, что вероятность большого успеха кинофильма весьма невысока, капиталовложения в магазины становятся более привлекательными, поскольку вероятность получения указанных 20% очень значительна. В случае если взять более простой пример, то выплаты при ставках в заезде на длинную дистанцию на скачках выше, поскольку выше вероятность, что не выиграешь вообще ничего.

Вероятность прямо влияет на определœение ожидаемого значения - центральной концепции платежной матрицы. Ожидаемое значение альтернативы или варианта стратегии - это сумма возможных значений, умноженных на соответствующие вероятности. К примеру, в случае если вы считаете, что вложение средств (как стратегия действий) в киоск для торговли мороженым с вероятностью 0,5 обеспечит вам годовую прибыль 5000 долл., с вероятностью 0,2 - 10 000 долл. и с вероятностью 0,3 - 3000 долл., то ожидаемое значение составит:

5000 (0,5) + 10 000 (0,2) + 3000 (0,3) = 5400 долл.

Определив ожидаемое значение каждой альтернативы и расположив результаты в виде матрицы, руководитель без труда может установить, какой выбор наиболее привлекателœен при заданных критериях. Он будет, конечно, соответствовать наивысшему ожидаемому значению. Исследования показывают: когда установлены точные значения вероятности, методы дерева решений и платежной матрицы обеспечивают принятие более качественных решений, чем традиционные подходы.

Рис. 8.5.Дерево решений.

Платежная матрица - понятие и виды. Классификация и особенности категории "Платежная матрица" 2017, 2018.

  • -

    Все решения, которые принимаются на основе платежной матрицы без учета численных значений вероятностей исхода событий, будут "оптимистическими" решениями, т.к. они ориентируются на наиболее благоприятный исход событий. Такой подход можно признать оправданным... .


  • - Платежная матрица с учетом вероятностей исходов

    Рис. 7.1. Платежная матрица без учета вероятностей исходов событий Платежная матрица без учета вероятностей исходов Метод платежной матрицы МЕТОДЫ ПРИНЯТИЯ РЕШЕНИЙ Этап 9. Проведение анализа... .


  • - Платежная матрица без учета вероятностей исходов

    Метод платежной матрицы МЕТОДЫ ПРИНЯТИЯ РЕШЕНИЙ Этап 8. Рис. 6.2. Диаграмма влияния, связывающая базовые проблемы. Данная диаграмма учитывает только отрицательные взаимосвязи, т.к. она предназначена для анализа... .


  • - Платежная матрица

    Рассмотрим игру, в которой игрок имеет стратегий, а игрок («противник») - стратегий. Такая игра называется игрой. Наши стратегии будем обозначать, противника - . Предположим, что каждая сторона выбрала определенную стратегию: мы выбрали, противник. Выбор стратегии... .


  • - Парная игра с нулевой суммой. Платежная матрица.

    Рассмотрим парную конечную игру с нулевой суммой с игрокам А и В, которые имеют конечное число стратегий соответственно А1, А2, ... Аm и В1, В2, ... Вn. Такая игра называется игрой mxn. Исход каждой партии завершается выигрышем одного из игроков. Обозначим aij- выигрыш игрока А, если...



  •  


    Читайте:



    Праздник непослушания (Повесть-сказка) Праздник непослушания герои сказки

    Праздник непослушания (Повесть-сказка) Праздник непослушания герои сказки

    Михалков Сергей Владимирович Праздник Непослушания Сергей Владимирович Михалков Праздник Непослушания Повесть-сказка "Праздник Непослушания" -...

    Почвенный покров южной америки

    Почвенный покров южной америки

    Страница 1 В отличие от Северной Америки, где изменения в растительном покрове зависят в значительной степени от изменений температурных условий,...

    Расправленные крылья - музыкальная пауза Порядок описания Московской операции

    Расправленные крылья - музыкальная пауза Порядок описания Московской операции

    Ситуация на фронте весной 1942 года, планы сторон, немецкое наступление летом 1942 года, начало Сталинградской битвы, немецкий оккупационный режим,...

    Cобытия Второй мировой войны

    Cобытия Второй мировой войны

    Вторая мировая война считается самой крупной в истории человечества. Она началась и закончилась 2 сентября 1945 года. За это время в ней приняло...

    feed-image RSS