Инструменты пользователя

Инструменты сайта


examination:mo:question30

Критерии Вальда, Сэйвиджа и Гурвица для принятия решений в условиях полного отсутствия информации о вероятностях состояния «Природы».

ЛПР - лицо принимающее решения.

Неопределенность, связанную с отсутствием информации о вероятностях состояний среды (природы), называют «безнадежной» или «дурной».

В таких случаях для определения наилучших решений используются следующие критерии: максимакса, Вальда, Сэвиджа, Гурвица.

Применение каждого из перечисленных критериев проиллюстрируем на примере матрицы выигрышей или связанной с ней матри- цы рисков.

Критерий максимакса. С его помощью определяется стратегия, максимизирующая максимальные выигрыши для каждого состояния природы. Это критерий крайнего оптимизма. Наилучшим признается решение, при котором достигается максимальный выигрыш, равный

<m>M={max}under{1⇐i⇐m}{max}under{1⇐j⇐n}a_{ij}</m>.

Максиминный критерий Вальда. С позиций данного критерия природа рассматривается как агрессивно настроенный и сознательно действующий противник типа тех, которые противодействуют в страте- гических играх (см. гл. 2). Выбирается решение, для которого достигается значение

<m>W={max}under{1⇐i⇐m}{min}under{1⇐j⇐n}a_{ij}</m>.

В соответствии с критерием Вальда из всех самых неудачных результатов выбирается лучший. Это перестраховочная позиция крайнего пессимиста, рассчитанная на худший случай. Такая стратегия приемлема, например, когда игрок не столь заинтересован в крупной удаче, но хочет себя застраховать от неожиданных проигрышей. Выбор такой стратегии определяется отношением игрока к риску.

Критерий минимаксного риска Сэвиджа. Выбор стратегии аналогичен выбору стратегии по принципу Вальда с тем отличием, что игрок руководствуется не матрицей выигрышей А, а матрицей рисков R:

<m>S={min}under{1⇐i⇐m}{max}under{1⇐j⇐n}r_{ij}</m>.

Минимально возможный из самых крупных рисков.

Критерий пессимизма—оптимизма Гурвица. Этот критерий при выборе решения рекомендует руководствоваться некоторым средним результатом, характеризующим состояние между крайним пессимизмом и безудержным оптимизмом. Согласно этому критерию, стратегия в матрице А выбирается в соответствии со значением

<m>H_{A}={max}under{1⇐i⇐m} delim{lbrace}{p{min}under{1⇐j⇐n}a_{ij}+(1-p){max}under{1⇐j⇐n}a_{ij}}{rbrace}</m>,

где p — коэффициент пессимизма (0≤р≤1). При p=0 критерий Гурвица совпадает с максимаксным критерием, а при p=1 — с критерием Вальда.

Применительно к матрице рисков R критерий пессимизма— оп- тимизма Гурвица имеет вид:

<m>H_{R}={max}under{1⇐i⇐m} delim{lbrace}{p{max}under{1⇐j⇐n}r_{ij}+(1-p){min}under{1⇐j⇐n}r_{ij}}{rbrace}</m>.

При р=0 выбор стратегии игрока 1 осуществляется по условию наименьшего из всех возможных рисков; при р=1 — по критерию минимаксного риска Сэвиджа.

В случае, когда по принятому критерию рекомендуются к ис- пользованию несколько стратегий, выбор между ними может делаться по дополнительному критерию, например в расчет могут приниматься средние квадратичные отклонения от средних выигрышей при каждой стратегии. Выбор может зависеть от склонности к риску ЛПР.

Таким образом, в случае отсутствия информации о вероятностях состояний среды теория не дает однозначных и математически строгих рекомендаций по выбору критериев принятия решений. Это объясняется в большей мере не слабостью теории, а неопределенностью самой си- туации. Единственный разумный выход в подобных случаях — попы- таться получить дополнительную информацию, например, путем прове- дения исследований или экспериментов. В отсутствие дополнительной информации принимаемые решения теоретически недостаточно обосно- ваны и в значительной мере субъективны. Хотя применение математиче- ских методов в играх с природой не дает абсолютно достоверного ре- зультата и последний в определенной степени является субъективным (вследствие произвольности выбора критерия принятия решения), оно тем не менее создает определенное упорядочение имеющихся в распо- ряжении ЛПР данных: определяются множество состояний природы, альтернативные решения, выигрыши и потери при различных сочетани- ях состояния «среда — решение». Такое упорядочение представлений о проблеме само по себе способствует повышению качества принимаемых решений.

examination/mo/question30.txt · Последние изменения: 2014/01/15 08:19 (внешнее изменение)