Android-приложение для поиска дешевых авиабилетов: play.google.com
Главная -> Дистанционное зондирование

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 [47] 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129

к какому классу принадлежит X?

111.7. Чтотакое обучающий образ?

111.8. Почему желательно иметь несколько обучающих образов для каждого из идентифицируемых классов?

Цели изучения

После изучения разд. П1.4, П1.5 и П1.6 читатель должен уметь:

1. Перечислить три причины, благодаря которым статистический подход пригоден при применении распознавания образов для анализа данных дистанционных измерений.

2. Различать параметрический и непараметрический методы распознавания образов и приводить по крайней мере одно преимущество и один недостаток каждого из них.

3. Изобразить одномерную (однопеременную) нормальную функцию плотности и дать два параметра, которые необходимы для спецификации функции плотности. Описать процесс обобщения для многомерного случая.

4. Ссылаться на две предосторожности, которые необходимо соблюдать, когда функции распределения вероятностей, связанные с классами образов, должны аппроксимироваться нормальными функциями плотности.

5. Обсуждать термины, используемые в решающем правиле по максимуму правдоподобия, касающиеся статистических выражений физических явлений, реально наблюдаемых в процессе дистанционного зондирования.

6. Объяснить, как может быть приспособлена система распознавания образов для обнаружения многих точек в классифицируемой области, которые фактически не представлены ни одним из обучающих классов.

111.4. Статистический подход: обоснование и пример

Методы статистического распознавания образов особенно -подходят для прикладных дистанционных исследований в силу ряда причин:

1. Вследствие случайного характера природных процессов данные дистанционных измерений содержат много случайных вариаций, маскирующих характерные различия между интересующими нас классами. Статистический анализ позволяет учесть эти вариации и потенциально уменьшить их отрицательное влияние на точность классификации.

2. На практике часто имеется, хотя и малая, неопределенность относительно правильной идентификации обучающих образов, используемых для определения дискриминантных функций. Например, некоторые обучающие образы с «кукурузного поля» могут быть с большим основанием отнесены к «сорнякам» или «обнаженной почве». Статистические методы допускают такие ошибки, пока их частота повторения относительно мала.

3. Исследуемые классы образов могут в действительности перекрываться в пространстве измерений, т. е. некоторые изме-148



рения из одного класса могут быть неотличимы от некоторых измерений других классов. Например, в определенные моменты вегетационного периода некоторые кукурузные поля спектрально неотличимы от соевых полей. В этих случаях методы статистического распознавания образов позволяют производить классификации, которые являются «наиболее часто» или «наиболее вероятно» правильными.

Методы статистического распознавания образов обычно используют функции распределения вероятностей, связанные с классами образов. Однако эти функции обычно не известны и должны оцениваться по множеству обучающих образов. В некоторых случаях форма функций распределения вероятностей считается известной (например, нормальной, Релея), и по обучающим образам необходимо оценить только отдельные параметры, связанные с этими функциями (такие, как математические ожидания, дисперсии). Такой метод называется параметрическим. Если форма функций распределения вероятностей не предполагается известной заранее, метод является непараметрическим. Параметрические методы обычно легче реализуются, но требуют большего объема априорной информации или фундаментальных предположений относительно природы образов. Непараметрические методы имеют большие потенциальные возможности для точной оценки функций распределения вероятностей, но это преимущество обычно достигается дорогой ценой, требуя сложных распознающих систем и очень большого числа обучающих образов.

Простой пример проиллюстрирует большинство понятий, обсуждавшихся в данной главе до сих пор, включая использование функций распределения вероятностей в процессе классификации. На этот пример ссылки будут встречаться и в дальнейшем.

Пример. Игра в кости. Два игрока заняты игрой двумя парами костей, одна из которых - «стандартная» (помеченная от одной до шести точками на кал<дой из сторон), другая - «подправленная», с двумя дополнительными точками на каждой из сторон (от трех до восьми точек на плоскости). Игрок 1 выбирает пару костей произвольно и бросает, не показывая их игроку 2. Затем он сообщает ему (честно) сумму вылавших очков. Игрок 2 после этого пытается угадать, какая пара была брошена, поставив доллар на то, что он может угадать правильно.

Какому правилу решений должен следовать игрок 2, чтобы выигрыш был максимальным (или проигрыш минимальным)?

В этом примере сумма, получающаяся при каждом бросании костей, образует измерение. Игрок 1 выступает в роли датчика, фиксирующего число выпавших очков на костях. Пространство измерений одномерное (рис. П1.9, а).

При предположении, что игрок 2 отчасти знаком со статистикой и представляет физическую природу костей (оба набора), он имеет достаточно информации для вычисления функций распределения вероятностей, связанных с получением каждой суммы очков. На рис. П1.9, б изображены эти функции. На этом



рисунке обозначение р (%стандартные кости) следует понимать как вероятность выпадения суммы х при условии, что были брошены «стандартные кости», и аналогично для р (xjподправленные кости). Высота гистограмм дает относительную частоту выпадения каждой суммы для каждой пары костей. Например, если брошены стандартные кости, то сумма 5 выпадает примерно 4/36 раза, но сумма 14 не выпадает никогда. С другой стороны, при бросании подправленной пары костей сумма 14 выпадает примерно 3/36 раза. Если игрок 2 не знал этих функций распределения вероятностей, он может оценить

1 234 56 789

-X-X-X-X-Ю !1 12 13 14 15 16

6/36 5/36 4/36 3/36 2/36 1/36

р (х I стандартные кости) р (л-1 подправленные

I---1 кости)

1 I

i---1

1 2 3 4 5 6 7 8 9 10 М 12 !3 14 15 16 х

X 2

Рис. III.9. Игра в кости, пример:

а - пространство измерений, х - выброшенная сумма; б - функции распределения вероятностей для возможных сумм пар костей.

1 - возможное значение для стандартной пары; 2 - возможное значение для подправленной пары; 3 - возможное значение для обеих пар

ИХ ПО «обучающим образам», если игрок 1 позволит игроку 2 бросить кости много раз, и отмечать при этом частоту повторения сумм для каждой пары.

Чтобы интуитивно почувствовать, каким образом игрок 2 может использовать функции распределения вероятностей для увеличения возможности выигрыша при каждом бросании, рассмотрим рис. 111.9,6 и решим для себя, какая пара была брошена, если получена сумма 4; 15; 7; 9. Насколько твердо Вы уверены в своем решении в каждом из этих случаев?

Когда сумма равна 4, игрок 2 с полной уверенностью может утверждать, что была брошена стандартная пара. Сумма 15 указывает наверняка, что была брошена подправленная пара. Игроку 2 следует решить: «стандартная» при сумме 7 и тогда он выиграет примерно в 75% случаев. Когда сумма равна 9, 150



0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 [47] 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129



0.0867
Яндекс.Метрика