Классификация Почвенно-Растительного Покрова С EOSDA
Классификация землепользования и почвенно-растительного покрова – это тип геопространственных данных в визуальном формате, который классифицирует поверхность Земли по отдельным классам, таким как лес, вода, сельскохозяйственные культуры и т.д. Использование данных дистанционного зондирования и геопространственных данных для выявления изменений почвенно-растительного покрова позволяет оценить динамику использования земель или то, как изменение климата меняет поверхность Земли в конкретных регионах. Это также помогает разрабатывать решения, основанные на данных, для инфраструктурных объектов, например, для определения мест строительства новых дорог, зданий или заводов.
Спутниковые снимки содержат большое количество данных не только в видимом диапазоне (RGB), но и в других участках электромагнитного спектра, которые не различает человеческий глаз. Мультиспектральное спутниковое изображение позволяет с большей точностью отличить один тип сельскохозяйственных культур от другого, чем при взгляде на обычную фотографию. Однако для успешной классификации почвенно-растительного покрова необходимо обучить специальную модель нейронной сети.
Клиенты EOS Data Analytics – живое подтверждение растущего спроса на такие модели. В данном обзоре мы расскажем о том, как происходит обучение этих моделей на примере трех случаев их применения в Болгарии, Нигерии и Бразилии.
Для Чего Предприятия Заказывают Классификацию Почвенно-Растительного Покрова
Если вы новичок в сфере геопространственного анализа, вас можете удивлять тот факт, что компании все чаще заказывают классификацию почвенно-растительного покрова. Ведь можно посмотреть на спутниковый RGB-снимок и определить географические объекты невооруженным глазом. Зачем им растровые изображения леса с цветовой маркировкой, если они и так видят лес на снимке в естественном цвете?
Ответ – для количественной оценки. Предприятиям необходимо выразить динамику изменений в цифрах, иначе они не смогут управлять земельными ресурсами. Они хотят предсказать объем конечного продукта, который смогут произвести и продать на основе урожайности, распределить необходимый бюджет, предложить соответствующие технические решения, логистику и т.д. А визуальное представление классификации почвенно-растительного покрова в виде простых цветов на географической карте помогает человеку осмыслить ее результаты. Некоторые закономерности можно выявить только визуализировав и проанализировав данные с точки зрения человека, добавив сюда интуицию, индивидуальные воспоминания и восприятие, а также нелинейные логические закономерности, о которых никогда не догадался бы даже самый умный компьютер.
Очень важно постоянно настраивать точность алгоритмов картирования, поскольку почвенно-растительный покров – крайне изменчивая величина, которая регулярно претерпевает изменения. Сменяются сезоны, повышается и понижается уровень воды, выпадают дожди и т.д. Поэтому нейронная сеть должна раз за разом подстраиваться под новые обстоятельства и их связи друг с другом.
Например, если вы имеете дело с весенним паводком на плоской местности, то как узнать, куда вода потечет на этот раз? Это все равно что пролить стакан воды на стол: траектория движения в целом понятна, но несколько неопределенна, зависит от фактуры и размера стола, скорости переворачивания стакана, предметов, находящихся на нем, и т.д. Аналогичным образом, поток воды может буквально хлынуть куда угодно, но при этом есть некоторые зависимости, которые человеческий мозг практически не в состоянии предсказать, ведь существует очень много переменных с разной степенью корреляции. Вот тут на помощь и приходит искусственный интеллект.
Команда ученых EOSDA постоянно работает над обучением нейросетевых моделей для классификации почвенно-растительного покрова. Для того чтобы обеспечить максимальную точность, мы разработали собственную полносвязную регрессионную модель (Fully Connected Regression Model, FCRM). Давайте узнаем, как она работает, и рассмотрим несколько показательных примеров, в которых наш алгоритм показал отличные результаты.
Классификация Почвенно-Растительного Покрова: Как Мы Это Делаем
1. Сбор и предварительная обработка данных. Сначала мы собираем спутниковые изображения и соответствующие им наземные данные (например, погоду или уровень осадков) для различных классов почвенно-растительного покрова. Предварительная обработка заключается в построении временных рядов для классификации, сегментации изображений на участки и присвоении меток наземным данным.
2. Построение архитектуры. На этом этапе мы программируем индивидуальную полносвязную регрессионную модель для каждого класса, которая на выходе преобразуется в линейную регрессию. Если вы никогда не сталкивались с нейронными сетями, все эти термины могут показаться непонятными, но на самом деле они проще, чем кажутся. К примеру, “полносвязная” означает, что все входы и все узлы (слои) связаны друг с другом, а простейшая линейная регрессия может быть описана как линейное уравнение с угловым коэффициентом,
которое все мы изучали в школе. Здесь x – независимая переменная, а y – зависимая переменная. Они имеют линейную зависимость, где каждое значение y зависит от значения x.
В нейронной сети спутниковые (входные) данные можно представить как x и y, а саму функцию – как нейрон. Подобно нейронам в организме человека, нейроны функции срабатывают только при выполнении определенного условия.
Наш алгоритм включает в себя несколько нейронов (функций), связанных между собой. На выходе мы получаем функцию активации линейной регрессии, принимающую на вход множество логистических (бинарных) регрессий, что само по себе является довольно интересным решением. Модель должна сделать большое количество многовариантных выборов, прежде чем принять окончательное решение. Это похоже на разветвленную цепь условий “если” для каждого пикселя, на которые разбивается спутниковый снимок, а затем преобразовывается и снова собирается воедино, как робот-трансформер.
Непрерывные выходные данные отображают вероятность принадлежности исходных входных данных к определенному классу. Итак, сначала мы получаем множество возможных значений, а затем разбиваем его на диапазоны, которые показывают степень связи между входными переменными. Наконец, выбранному диапазону присваивается определенный класс.
3. Разбиение набора данных. Мы делим предварительно обработанный набор данных на обучающий, валидационный и тестовый наборы, используя соответствующее соотношение (например, 70% обучающих, 15% валидационных и 15% тестовых данных). Мы также стараемся сделать так, чтобы все классы были равномерно представлены в каждом наборе.
4. Обучение моделей. Мы обучаем каждую полносвязную регрессионную модель отдельно на обучающем наборе, минимизируя среднюю квадратичную ошибку (MSE) между предсказанными вероятностями и метками наземных данных. В процессе обучения мы используем алгоритмы оптимизации для итеративного обновления параметров модели. Затем мы регуляризируем модели для предотвращения переобучения (обучения на шумах) с помощью таких техник, как прореживание или снижение веса.
5. Мониторинг эффективности валидации. В процессе обучения мы отслеживаем эффективность работы каждой модели на контрольной выборке с помощью таких оценочных показателей, как R-квадрат или средняя абсолютная ошибка (MAE). При необходимости мы корректируем такие гиперпараметры, как скорость обучения, размер выборки или сложность модели. Как правило, универсального решения по ним не существует, поэтому каждый раз мы выполняем их тонкую настройку.
6. Сборка ансамбля. Используя ансамблевые методы, мы комбинируем прогнозы отдельных моделей для получения итоговой классификации типов почвенно-растительного покрова.
7. Оценка эффективности тестового набора. Мы оцениваем общую работоспособность нашего алгоритма на тестовых данных (которые модель еще не “видела”), используя такие метрики, как статистическая ошибка и матрица несоответствий.
8. Тонкая настройка и итерации. На этом этапе мы повторяем шаги 2-7, совершенствуя архитектуру, гиперпараметры или ансамблевый метод для повышения эффективности классификации.
9. Обрезка итогового результата. Наконец, мы подготавливаем выходную визуализацию в соответствии с заданными координатами области интереса (AOI).
EOSDA Crop Monitoring
Платформа для мониторинга полей, которая использует спутниковые снимки с высоким разрешением – выявляйте изменения и принимайте меры дистанционно!
Разница Классификаций: Сравнение EOSDA И Открытых Источников
Для валидации результатов алгоритма мы сравнили наши результаты с открытыми данными по классификации землепользования и почвенно-растительного покрова, полученными из двух источников. Назовем их Источник 1 и Источник 2.
Источник 1 предлагает данные за период с 2017 по 2022 год, а Источник 2 – за период с 2015 по 2019 год. Мы заметили, что результаты классификации, полученные крупными компаниями, могут различаться. Одной из возможных причин таких расхождений в классификации почвенно-растительного покрова являются различные методы агрегирования классов. Например, один поставщик данных может классифицировать леса как единый класс, в то время как модель другого поставщика различает разреженные и густые леса. В результате классы, представляющие относительно небольшие участки на интересующей территории, могут иметь существенные различия, как показано на графиках ниже. Однако это не относится к межгодовым изменениям в пределах одного и того же класса.
Далее представлена визуализация данных для территории города Варна, Болгария. Как правило, классы – непостоянная величина, которая незначительно варьируется из года в год. Ниже приведена более подробная разбивка за 2019 год, так как этот период является общим для обоих открытых источников.
На следующей диаграмме и иллюстрации приведена статистика, полученная с помощью модели EOSDA. Как видно, результаты классификации несколько отличаются.
Яркий пример: классификация почвенно-растительного покрова EOS Data Analytics предусматривает класс “травяной покров” (grassland) как для пастбищ, так и для участков с наличием низкорослых кустарников, в то время как в классификации Источника 2 эти значения относятся к совершенно разным классам. По этой причине процентное соотношение классов может отличаться.
Проведя сравнение, мы пришли к выводу, что результаты классификации почвенно-растительного покрова, полученные с помощью различных моделей, могут отличаться. Это может произойти в силу того, что визуально похожие, но разные по своей сути объекты могут быть отнесены к тому или иному классу в зависимости от алгоритма, исходных данных, процесса обучения и т.д. Для того чтобы правильно оценить уровень точности, необходимо проанализировать конкретный случай использования и наземные данные, применяемые для валидации.
Примеры Классификации Почвенно-Растительного Покрова На Основе Алгоритма EOSDA
Как видно из приведенного выше сравнения, ученым EOSDA удалось достичь высокого уровня детализации алгоритма классификации почвенно-растительного покрова. Вероятно, решающим фактором стало использование коротких периодов временных рядов спутниковых данных. Такой подход также позволяет получить более четкое представление о выявленных классах. Хотя следует признать, что и исходные данные должны быть представлены в достаточном количестве.
Для дальнейшей валидации нашей модели на различных ландшафтах и климатических условиях мы использовали для ее обучения данные из нескольких разных регионов. Результаты можно посмотреть на примерах ниже.
Регион №1: Болгария, 2021
Давайте рассмотрим результаты классификации землепользования и почвенно-растительного покрова Болгарии, полученные с помощью модели EOS Data Analytics. Здесь мы видим очень четкое выделение классов лесов (forest), водоемов (water) и пахотных угодий (cropland). Стоит отметить, что в случае с последним классом наблюдается сильная зависимость между количеством полученных входных изображений, сезонными колебаниями и результатом.
Итоговое изображение свидетельствует о том, что для обучения модели ученые EOSDA использовали качественные данные в достаточном количестве. Класс “земли, лишенные растительности” (bareland), представленный желтым цветом, содержит детальную фиксацию местной дорожной инфраструктуры. Модель также определила искусственные объекты (artificial).
Регион №2: Нигерия, 2021
Из данного результата обучения видно, что модель отнесла засушливые земли Нигерии к классу земель, лишенных растительности. Тем не менее ей также удалось с большой точностью определить немногочисленные водоемы и участки травяного покрова. Более мелкие территории класса водно-болотных угодий (wetland) демонстрируют сезонные паводки (или их отсутствие, что может указывать на засуху).
Регион №3: Южная Америка, 2021
В третьем примере приведен результат обучения нашей модели на исходных данных из Южной Америки. Здесь мы снова видим высокую детализацию в сочетании с плавными переходами между классами. Несмотря на то, что в данной AOI преобладают леса, на изображении присутствует четкое разделение между классом травяного покрова и классом лесов.
Заключительные Мысли
Предприятия различных индустрий могут использовать наши модели для получения более подробной информации о структуре землепользования, оптимизации распределения ресурсов и принятия обоснованных решений для повышения прибыльности. С более глобальной точки зрения, получив классификацию почвенно-растительного покрова интересующих территорий с точностью до сантиметра, местное население может принимать необходимые меры для сохранения окружающей среды и построения устойчивой инфраструктуры.
В основе каждой индивидуально обученной модели EOSDA лежит алгоритм, контролируемый человеком, именно поэтому нам и удается добиться настолько качественных результатов. В качестве отправной точки мы уже обучили нашу модель классификации землепользования и почвенно-растительного покрова на данных о различных географических регионах, о чем подробно рассказали в этой статье. Благодаря итеративной доработке архитектуры и параметров данных в каждом конкретном случае нашим ученым удается добиться значительного снижения статистической ошибки, т.е. повысить точность классификации.
Еще одним преимуществом является то, что чем больше индивидуальных моделей классификации обучают наши ученые, тем больше контекста в их распоряжении. Благодаря этому они могут создавать более “умные” модели в отличие от тех, кто не имеет опыта работы в этой области. Мы постоянно получаем ценные сведения о том, как спутниковый мониторинг способствует эффективному управлению земельными ресурсами, сохранению окружающей среды и изучению изменения климата.
Об авторе:
Рим Элайджа получила двойную степень в области делового администрирования и политологии в Стокгольмском университете. Будучи вице-президентом по продажам, она курирует все аспекты разработки и внедрения бизнес-моделей, а также расширения глобального присутствия EOSDA. Рим удалось установить ряд успешных стратегических партнерств с упором на предоставление устойчивых решений в Африке и Азии.
Последние cтатьи
Выращивание Винограда: Как Сажать, Ухаживать И Собирать Урожай
Традиции сочетаются с современными технологиями посадки и выращивания винограда. Вековая мудрость гарантирует правильную обрезку винограда, а спутники отслеживают стресс лозы и управляют удобрениями.
Выращивание Свеклы: От Посадки Семян до Хранения Урожая
Выбор сорта свеклы и места выращивания – это лишь первый шаг на пути к хорошему урожаю свеклы. На всех этапах выращивания культуры точное земледелие станет незаменимым помощником.
Выращивание Салата: Как Сажать, Ухаживать И Собирать
Выращивание салата привлекло внимание фермеров благодаря возможности собирать несколько урожаев в год. Чтобы разнообразить план посевов, салат можно выращивать чередуя с другими культурами.