
Оценка Урожайности Хлопка В Техасе: Проверка Концепции
На протяжении столетий фермеры хотели знать возможную урожайность своих полей, чтобы выбрать наиболее прибыльную культуру и минимизировать риски различных негативных факторов. Теперь точную оценку и прогнозирование урожайности можно делать разными способами, одним из которых является использование алгоритмов искусственного интеллекта и машинного обучения. EOS Data Analytics (EOSDA), глобальный поставщик аналитики спутниковых изображений на базе ИИ, разработала индивидуальное решение для прогнозирования урожайности. Этот инструмент позволяет компании точно прогнозировать объем урожая с помощью дистанционного зондирования и машинного обучения (ML).
Недавно EOSDA завершила индивидуальный проект, чтобы убедиться, что модель применима и к хлопку. Модель прогнозирования урожайности необходимо было скорректировать в соответствии со спецификой этой культуры, поэтому команда собрала наборы данных, засучила рукава и взялась за дело. Вот как это было.
Вызов | Прогнозирование урожайности хлопка в Техасе было непростой задачей, поскольку для модели отсутствовали данные. Команда EOSDA использовала имеющиеся у них наборы данных по пяти округам. |
Решение | Команда выбрала модель Random Forest Regression, собрала все данные, которые смогла найти, и скорректировала модель прогнозирования урожайности таким образом, чтобы она могла точно предсказывать урожайность именно хлопка. |
Результат | Им удалось спрогнозировать урожайность с точностью 80%. Модель имеет потенциал развития. |
Обзор: Производство Хлопка В Техасе
Хлопок используется везде, от футболки до долларовой купюры. Он занимает сотни и тысячи акров пахотных земель, а Соединенные Штаты являются третьей страной-производителем хлопка и одним из крупнейших экспортеров в мире . В США Техас отвечает за 40% производства хлопка . В этом штате многие поколения фермеров выращивают эту культуру на протяжении столетий.
Однако ситуация меняется. Волны тепла, засухи и другие природные явления создают суровые условия для выращивания хлопка, в результате чего фермеры и агробизнес теряют миллиарды долларов . Речь идет не только о прямом влиянии на урожайность, но и о нарушении графика посадки, истощении водных ресурсов и росте распространенности вредителей и болезней.
Из-за столь интенсивного изменения климата фермеры вынуждены внедрять новые методы ведения сельского хозяйства, инвестировать в дорогостоящие системы орошения и приобретать инструменты, которые могут точно предсказывать засухи или показывать их последствия, чтобы они могли действовать как можно раньше. Одним из инструментов, который может помочь производителям хлопка бороться с последствиями климатических изменений, является оценка и прогнозирование урожайности.
Данные прогнозирования урожайности действительно могут помочь во многих отношениях. Они могут гарантировать эффективное использование ресурсов, улучшить финансовое планирование и обеспечить бесперебойную работу цепочки поставок. Точные прогнозы могут помочь снизить риски, направлять рыночные стратегии и выполнять контракты. В целом, это приводит к более плавной работе, лучшему финансовому благополучию и более прочной позиции на рынке.
Команда ученых EOS Data Analytics решила проверить свою модель прогнозирования урожайности на хлопке, чтобы убедиться в ее точности.
Проблемы: Недостаточно Данных Для Прогнозирования Урожайности Хлопка
Научной команде необходимо было протестировать модель прогнозирования урожайности, чтобы убедиться, что она работает для хлопка с удовлетворительной точностью в разных округах, учитывая различия в условиях роста урожая и доступности данных. Поскольку для модели требовалось много разных наборов данных, группа объединила исторические данные о погоде, информацию о календаре севооборота, статистику урожайности и другую соответствующую информацию.
Для Техаса не было достаточно данных. Была информация по урожаю за четыре или пять предыдущих лет для нескольких округов, но она была недостаточно точной, чтобы применить нашу текущую модель. Проект пошел бы гораздо более гладко, если бы набор данных был основан на полях с известными датами посева.
Однако при наличии данных цели тестирования модели на хлопке были следующими:
- Проверка точности модели;
- Выявление потенциальных проблем и способов улучшения модели для областей интереса (area of interest, AOI);
- Принятие обоснованного решения о дальнейшем расширении проекта.
Решения: Корректирование Модели
Исследование было сосредоточено на оценке урожайности в 2023 году. Областью интереса, согласно имеющимся данным USDA’s National Agricultural Statistics Service, Техасского полевого офиса (часть Регионального полевого офиса Южных равнин), были пять центральных хлопкопроизводящих округов — Лаббок, Хейл, Линн, Кросби и Нуэсес. Эти районы были выбраны из-за их значительного производства хлопка и наличия высококачественных спутниковых снимков. Их границы можно увидеть на картах ниже.


Данные, использованные в проекте, включали статистику урожайности, данные о погоде, данные календаря севосмены и другие входные наборы данных, такие как растровый результат и пограничный слой поля.
Статистика урожайности, как уже упоминалось, была взята из USDA’s National Agricultural Statistics Service (Национальной службы сельскохозяйственной статистики Министерства сельского хозяйства США) для целевых округов с 2020 по 2022 год.
Однако для информации о погоде требовались данные за тот же период в течение сезона сбора урожая хлопка с платформы Copernicus Climate Data Store. Эти данные включали среднемесячные данные о температуре на уровне 2 м, испарении, солнечной радиации, температуре поверхности почвы на двух уровнях 0-7 см и 7-28 см, солнечной радиации, суммах осадков и влажности почвы на четырех уровнях: 0-7 см, 7-28 см, 28-100 см и 100-289 см.
Данные календаря севооборота были общедоступны в календаре севооборота хлопка в Техасе и его округах. Анализировался период роста с марта по октябрь для каждого сезона с 2020 по 2023 год. Также использовались другие входные наборы данных, такие как производство хлопка на уровне поля. Эти наборы данных включали растровый результат классификации урожая и векторный слой с обнаруженными границами полей для всей AOI, оба были выполнены командой EOSDA ранее.
Для оценки урожайности хлопка для целевых округов в этом проекте научная команда вместе с командами дата-инженеров и анализа данных выбрали модель Random Forest Regression. Эта модель была выбрана из-за ее эффективных вычислений и возможности работать с ограниченными агрегированными входными данными. Random Forest Regression — это контролируемый алгоритм обучения и метод бэггинга, который использует ансамблевое обучение для регрессии в МО — деревья в случайном лесу работают параллельно, не взаимодействуя во время их построения. Основными предикторами в модели были погодные данные для вегетационных периодов, агрегированные на ежемесячном уровне, а также данные о почве и фенологии за период 2020-2023 гг. Целевой переменной были статистические данные об урожайности на уровне округа за те же годы.
Для расчета производства в этом проекте использовались простые математические операции. В частности, полученное для каждого округа значение урожайности умножалось на количество акров каждого обнаруженного поля. Количество акров определялось по векторной маске с границами поля. Таким образом, производство конкретного поля в определенном округе рассчитывалось путем умножения его площади в акрах на урожайность в фунтах с акра для этого округа.
Проект был реализован в несколько основных этапов, каждый из которых содержал существенно важные детали. Команда EOS Data Analytics начала с анализа характеристик климатической зоны, вегетации и рельефа местности в этом районе. Затем был собран необходимый набор входных данных, включая статистику урожайности и данные о погоде. Затем модель была обучена с использованием данных за сезоны 2020-2022 годов. Последним шагом стало моделирование урожайности для оценки урожайности хлопка для каждого целевого округа в 2023 году.
Этап расчета производительности включал несколько задач постобработки. Команда отфильтровала результаты классификации культур по целевым округам, исключив все нецелевые культуры и оставив только хлопок. Затем эти результаты были векторизованы и объединены с данными определения границ полей. Затем они рассчитали площадь каждого обнаруженного хлопкового поля в целевых округах и выполнили расчеты производства для каждого поля в соответствии с ранее описанной методологией.
Заключительным этапом стала подготовка финальных векторных слоев, создание карт визуализации и составление отчета по проекту.
Сама модель не уникальна, но количество и качество предикторов различаются от компании к компании. Данные, используемые для построения связи модели с нашим целевым прогнозируемым значением урожайности, в каждом случае различны.
Результаты: Точность В Прогнозировании Урожайности Хлопка
Проектный отчет показал визуализацию результатов, как можно увидеть на изображениях ниже.


Точность тестовой выборки составила около 80%, и она была оценена с использованием подхода перекрестной проверки. Этот уровень точности можно считать удовлетворительным для моделей оценки и прогнозирования урожайности. Проект доказал, что EOS Data Analytics автоматизирует процессы МО и ИИ, экономя время и ресурсы, которые обычно тратятся на ручной сбор и анализ данных. Это помогает нашим партнерам оставаться конкурентоспособными на рынке сырьевых товаров.
Существуют также определенные перспективы для масштабирования модели. Используемый подход может быть масштабирован на более крупные площади, если необходимо, или сжат с соответствующим объемом данных. Чем больше предикторов использует модель, тем точнее она становится. Например, добавление температуры, относительной влажности почвы, общей или наземной производительности, общей потребности в воде и потреблении только повысит точность модели прогнозирования урожайности.
Хотя биофизическое моделирование и усвоение спутниковых данных, такие как WOFOST, не использовались в этом проекте, включение таких моделей может стать будущим шагом для повышения точности и служить дополнительным предиктором для оценки урожайности.
Мы являемся компанией, работающей со спутниковыми данными, поэтому в этой модели мы также можем использовать средние индексы растительности, такие как нормализованный разностный вегетационный индекс, индекс листовой поверхности или нормализованный разностный водный индекс. Эти индексы можно получить только сверху, из аналитики спутниковых снимков.
Оценка урожайности хлопка действительно возможна в Техасе, как доказывает эта история. Фермеры и агробизнес могут легко прогнозировать уровень урожая, используя такие сервисы, как Прогнозирование Урожайности Сельскохозяйственных Культур. Перспективы разработки этой модели огромны, поэтому наша команда с нетерпением ждет возможности протестировать их все.
Об авторе:
Ксения Кунах имеет более 6 лет опыта написания текстов, работая в различных сферах, включая бизнес, образование и медиа-тексты. Предыдущий опыт Ксении как менеджера по развитию в украинской эко-НПО и менеджера по подбору персонала в ІТ-компании делает ее идеальным сочетанием человека, который увлекается эко-технологическими инновациями и умеет легко о них рассказывать.
Последние cтатьи

Ложная Мучнистая Роса: Определение И Борьба С Болезнью
Ложная мучнистая роса - болезнь, требующая ранней диагностики и быстрого принятия мер. Профилактика проведенная вовремя, поможет сохранить культуру и благоприятно скажется на показателях урожая.

Дифференцированное Внесение Удобрений: Использование и Преимущества
Технология внесения удобрений с переменной нормой — лучшее решение для полей и фермеров. Узнайте больше о точном земледелии и особенностях дифференцированного внесения удобрений.

Фузариоз: Как Предотвратить И Победить Патоген
Споры фузариоза могут сохраняться в почве и заражать основные культуры, что делает его одним из самых стойких патогенов в сельском хозяйстве. Узнайте, как защитить свои посевы от этого возбудителя.