Android-приложение для поиска дешевых авиабилетов: play.google.com
Главная -> Дистанционное зондирование

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 [60] 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129

выборки. Ои «обучает» классификатор распознаванию информационных классов.

Второй метод, использующий кластерный анализ, называют неконтролируемой классификацией, так как аналитик да{ных мало влияет на установление границ решения.

Для завершения анализа спектральные классы должны быть преобразованы в информационные классы путем идентификации типа покрытия земной поверхности, соответствующего каждому спектральному классу. Ввиду ограниченного контроля со стороны исследователя неконтролируемая классификация - менее эффективный метод характеризации информационных классов, чем контролируемая классификация. Это особенно справедливо, когда информационные классы лишь частично разделимы в пространстве измерений (например, два вида сельскохозяйственных культур, имеющие слабые спектральные различия). Поэтому можно ожидать, что неконтролируемый анализ, основанный полностью иа неконтролируемой классификации, может дать надежные результаты только тогда, когда информационные классы легко выделяются из многоспектральных данных.

Кроме того, появление спутниковых многоспектральных сканеров для сбора данных дистанционных измерений свидетельствовало о том, что для многих применений только контролируемый анализ больше невозможен. Области, подлежащие анализу, слишком велики и неоднородны, и часто оказывается непрактичным собирать достаточные обучающие выборки, чтобы охарактеризовать все типы покрытия земной поверхности в области. Это может оказаться слишком дорого или даже физически невозможно. Более того, трудно точно локализовать районы, содержащие «чистые» выборки информационных классов, и они могут не содержать достаточного числа векторов измерений для адекватной оценки статистик классов. Чтобы провести оптимальный анализ таких данных, были разработаны процедуры, совмещающие контролируемый и неконтролируемый анализы. Одна из таких процедур приведена в заключительном разделе данной главы (см. табл. П1.1). Многие из процедур анализа, использовавшиеся в приложениях, описанных в гл. VI,. также комбинированные.

1И.11 .Подведение итогов

В начале этой главы мы видели, что работа по проектированию системы распознавания образов для анализа данных дистанционных измерений состоит в основном из определения,как лучше разделить пространство измерений на области решения так, чтобы каждая область соответствовала данному, представляющему интерес классу. Мы разрабатываем затем аналитические средства для выполнения этого на основе статистической оптимальности. Соответствующее заключение к этой главе - интеграция компонент в процедуру проектирования классификатора.



Шаги анализа данных, которые ведут к построению классификатора, их использование и оценка приведены в табл. III.1. Читатель обнаружит, что шаги даются в самых обших терминах. Как будет показано в гл. VI.6, детали процедуры анализа, используемой для любого данного применения дистанционного исследования, обязательно зависят от приборов дистанционного зондирования (например, разрешения датчика, имеющихся спектральных диапазонов), самого применения (например, как много классов должно быть выделено и насколько трудно они разделяются), наличных ресурсов для реализации процедуры анализа (например, размера и скорости ЭВМ).

Материал, представленный в данной главе, в основном был направлен на анализ спектрального содержания данных дистанционных измерений. Развитие технологии дистанционного зондирования в настояпгее время сфокусировано в основном на этом аспекте данных; другими словами, векторы признаков, используемые на входе процесса анализа, были почти исключительно векторами многоспектральных измерений, полученными непосредственно со сканеров или других источников многоспектральных данных. Однако в последних исследованиях большое значение стало придаваться полезности как пространственного, так и временного аспекта данных, которые были упомянуты в гл. I. Принимая точку зрения, что образ - это просто множество измерений, независимо от того, как они получены (см. разд. III.1), общая методология распознавания образов может быть расширена, чтобы иметь дело с пространственными (спектральными) и временными признаками, а также с множеством чисто спектральных признаков. Понятия, представленные здесь, остаются фундаментальными при таком расширении.

Задачи

111,26. Дайте нематематическое, интуитивное определение кластерного анализа и проиллюстрируйте два способа, с помощью которых кластерный анализ .может б.ыть использован в целях анализа многомерных данных.

II 1.27. Каковы три существенных элемента математического определения кластера? Приведите пример, иллюстрирующий тот факт, что кластеризация - неоднозначно определенная операция, а операция, зависящая от того, как определен кластер.

111.28. Сформулируйте условия, при которых можно ожидать, что методы неконтролируемой классификации будут работать хорощо.

111.29. Сформулируйте по крайней мере три практических ограничения контролируемой классификации.

П1.30. Используя данные табл. III.1 как ,план типичной процедуры численного анализа данных дистанционного зондирования, объясните цель или функцию каждого щага процедуры.

II 1.31. Две процедуры классификации описываются ниже.

Процедура анализа I. Подмножество данных было сформировано выбором информационных точек, соответствующих каждой пятой строке и столбцу.

Подмножество данных было кластеризовано. Первоначально было специфицировано восемь кластеров, но проверка кластерной разделимости показала, что некоторые кластеры могут быть объединены, в результате получили пять кластеров. Для каждого кластера вычислялись ковариационная матрица



Номер mat а

Операция

Используйте неконтролируемый анализ для улучшения исходных изображений путем извлечения и воспроизведения спектральных классов

Используйте справочные данные для связи информационных классов со спектральными классами. Отберите обучающие образы Примените кластерный анализ и анализ разделимости к обучающим образам для получения одномодальных классов Используйте отбор признаков нли выделение признаков для определения соответствующих признаков для классификации Выполните классификацию исследуемой области по правилу максимума правдоподобия

Оцените результаты: а) частоту отказов или «установление порога», б) точность классификатора на обучающих данных, в) точность классификатора на контрольных данных Доработайте анализ или подготовьте результаты для потребителя

и вектор математического ожидания, которые использовались для создания алгоритма классификации по максимуму правдоподобия. Затем все множество данных было классифицировано с использованием классификатора по максимуму правдоподобия. Каждому из пяти классов был приписан свой цвет, и цветное воспроизведение показывало, как была классифицирована каждая точка данных.

Процедура анализа II. Черно-белые изображения были получены из многоспектральных сканерных данных для представленного множества имеющихся спектральных зон. Работая со справочными картами области, аналитик идентифицирует и выделяет обучающие области-кандидаты для интересующих его типов покрытия. Затем каждая обучающая область-кандидат была кластеризована. Проверка полученных кластеров показала, что одна из обучающих областей составлена нз двух различных кластеров, в то время как другие области были существенно однородны. Два подкласса были определены для неоднородной обучающей области. Были вычислены статистики для обучающих областей, которые использовались для спецификации параметров классификатора ,по максимуму правдоподобия. Затем все множество данных было классифицировано, каждому обучающему классу был приписан свой цвет, и цветное воспроизведение показало, как была классифицирована каждая точка данных.

а) Является ли процедура I контролируемой или неконтролируемой? Что Вы можете сказать по этому поводу относительно процедуры И?

б) Укажите существенные различия между процедурами.

в) Какого рода интерпретацию можно дать классам, формируемым каждой процедурой?

г) При каких условиях можно ожидать, что процедура I будет работать хорошо?

д) Каковы некоторые практические ограничения процедуры II? Список литературы

1. Nilsson N. J. «Learning Machines*, McGraw-Hill Book Companv, New Yorl<, 1965.

* Нильсон H. Обучающиеся машины. М., Мир, 1967. (Прим. пер.)

Типичная процедура количественного анализа данных дистанционного зондирования



0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 [60] 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129



0.0102
Яндекс.Метрика