
Оцінка Врожайності Бавовни В Техасі: Доказ Концепції
Століттями фермери хотіли знати можливу врожайність своїх полів, щоб вибрати найбільш прибуткову культуру та мінімізувати ризики різних негативних факторів. Тепер точну оцінку врожайності та прогнозування можна зробити різними способами, одним із яких є використання штучного інтелекту та алгоритмів машинного навчання. EOS Data Analytics (EOSDA), глобальний постачальник аналітики супутникових зображень на основі штучного інтелекту, розробив спеціальне рішення для прогнозування врожайності. Цей інструмент дозволяє компанії точно прогнозувати обсяг врожаю за допомогою дистанційного зондування та машинного навчання (ML).
EOSDA нещодавно завершила індивідуальний проєкт, щоб переконатися, що модель можна застосовувати й до бавовни. Модель прогнозування врожайності потрібно було налаштувати відповідно до специфіки цієї культури, тому команда зібрала набори даних, засукала рукави та взялася за справу. Ось як відбувався цей процес.
Виклик | Передбачити врожайність бавовни в Техасі було непростим завданням, оскільки моделі бракувало даних. Команда EOSDA використала набори даних з п’яти округів. |
Рішення | Команда обрала модель Random Forest Regression, зібрала всі дані, які могла знайти, і налаштувала модель прогнозування врожайності, щоб вона могла точно передбачати врожайність саме бавовни. |
Результат | Їм вдалося передбачити врожайність з точністю до 80%. Модель має потенціал розвитку. |
Огляд: Виробництво Бавовни В Техасі
Бавовна використовується всюди, від футболки до доларової купюри. На її частку припадають сотні й тисячі гектарів орних земель, а Сполучені Штати є третьою провідною країною-виробником бавовни та одним із найбільших експортерів у світі . У США Техас відповідає за 40% виробництва бавовни . У штаті багато поколінь фермерів століттями вирощували цю культуру.
Однак ситуація змінюється. Хвилі спеки, посухи та інші природні явища створюють суворі умови для вирощування бавовни, в результаті чого фермери та агробізнеси втрачають мільярди доларів . Ми говоримо не лише про безпосередній вплив на врожайність, а й про порушення графіка посіву, виснаження водних ресурсів й збільшення поширеності шкідників і хвороб.
Через таку інтенсивну зміну клімату фермери змушені впроваджувати нові методи ведення сільського господарства, інвестувати у дорогі іригаційні системи та отримувати інструменти, які можуть точно передбачити посуху або показати її наслідки, щоб вони могли діяти якомога раніше. Одним з інструментів, який може допомогти виробникам бавовни боротися з наслідками змін клімату, є оцінка та прогнозування врожайності.
Дані про прогнозування врожайності дійсно можуть допомогти багатьма способами. Вони можуть забезпечити ефективне використання ресурсів, покращити фінансове планування та забезпечити безперебійну роботу ланцюжка постачання. Точні прогнози можуть допомогти зменшити ризики, керувати ринковими стратегіями та виконувати контракти. Загалом це сприяє більш плавній роботі, кращому фінансовому здоров’ю та зміцненню позицій на ринку.
Команда вчених EOS Data Analytics вирішила перевірити свою модель прогнозування врожайності на бавовні, щоб переконатися в її точності.
Проблеми: Недостатньо Даних Для Прогнозування Врожайності Бавовни
Науковій команді необхідно було перевірити модель прогнозування врожайності, щоб переконатися, що вона працює для бавовни із задовільною точністю в різних округах, враховуючи відмінності в умовах зростання врожаю та доступність даних. Оскільки модель вимагала багато різних наборів даних, команда об’єднала історичні дані погоди, інформацію календаря сівозміни, статистику врожайності та іншу відповідну інформацію.
Для Техасу не було достатньо даних. Були врожайні дані за останні чотири чи п’ять років для кількох округів, але вони не були достатньо точними, щоб застосувати нашу поточну модель. Проєкт пройшов би набагато легше, якби набір даних базувався на полях із відомими датами посіву.
Однак, маючи наявні дані, цілі тестування моделі на бавовні були такими:
- Перевірити точність моделі;
- Знайти потенційні проблеми та шляхи вдосконалення моделі для області інтересу (area of interest, AOI);
- Прийняти зважене рішення щодо подальшого розширення проєкту.
Рішення: Коригування Моделі
Дослідження було зосереджено на оцінці врожайності сільськогосподарських культур у 2023 році. Область інтересу, згідно з наявними даними USDA’s National Agricultural Statistics Service, Техаський польовий офіс (частина регіонального польового офісу Південних рівнин), охоплювала п’ять центральних округів, що вирощують бавовну — Лаббок, Хейл, Лінн, Кросбі та Нуесес. Ці території були обрані через значне виробництво бавовни та наявність високоякісних супутникових знімків. Їхні кордони можна побачити на картах нижче.


Дані, які використовувалися в проєкті, включали статистику врожайності, погодні дані, дані календаря сівозміни та інші вхідні набори даних, як-от растровий результат і граничний шар поля.
Статистичні дані про врожайність сільськогосподарських культур, як згадувалося, були взяті з USDA’s National Agricultural Statistics Service (Національної служби сільськогосподарської статистики Міністерства сільського господарства США) для цільових округів з 2020 по 2022 рік.
Однак для інформації про погоду були потрібні дані за той самий період у сезон посіву бавовни з платформи Copernicus Climate Data Store. Ці дані включали середньомісячні дані про температуру на рівні 2 м, випаровування, сонячну радіацію, температуру поверхні ґрунту на двох рівнях 0-7 см і 7-28 см, сонячну радіацію, загальну кількість опадів і вологість ґрунту на чотирьох рівнях: 0-7 см, 7-28 см, 28-100 см і 100-289 см.
Дані календаря сівозміни були загальнодоступними в календарі сівозміни бавовни в Техасі та його округах. Проаналізовано вегетаційний період з березня по жовтень для кожного сезону з 2020 по 2023 роки. Також використовувалися інші вхідні набори даних, як-от виробництво бавовни на рівні поля. Ці набори даних включали растровий результат класифікації культур і векторний шар із виявленими межами поля для всієї AOI, обидва виконані командою EOSDA раніше.
Щоб оцінити врожайність бавовни в цільових округах у цьому проєкті, наукова команда разом із командами дата-інженерів та аналізу даних обрала модель Random Forest Regression. Ця модель була обрана завдяки її ефективним обчисленням і здатності працювати з обмеженими агрегованими вхідними даними. Random Forest Regression — це контрольований алгоритм навчання та техніка пакетування, яка використовує ансамблеве навчання для регресії в ML — дерева у випадковому лісі працюють паралельно, не взаємодіючи під час їх побудови. Основними предикторами в моделі були погодні дані за вегетаційні періоди, агреговані на місячному рівні, а також ґрунтові та фенологічні дані за період 2020-2023 років. Цільовою змінною були статистичні дані про врожайність на рівні округу за ті самі роки.
У цьому проєкті для розрахунків виробництва використовувалися прості математичні операції. Зокрема, значення врожайності, отримане для кожного округу, було помножено на кількість акрів кожного виявленого поля. Кількість акрів визначали за векторною маскою з межами поля. Таким чином, виробництво певного поля в конкретному окрузі було розраховано шляхом множення його площі в акрах на врожайність у фунтах на акр для цього округу.
Проєкт здійснювався в кілька основних етапів, кожен з яких оперував важливими деталями. Команда EOS Data Analytics почала з аналізу характеристик кліматичної зони, рослинності та рельєфу місцевості. Після цього було зібрано необхідні вхідні дані, включаючи статистику врожайності та погодні дані. Потім модель навчили з використанням даних за сезони 2020-2022 років. Останнім кроком було моделювання врожайності для оцінки врожайності бавовни в кожному цільовому окрузі у 2023 році.
Етап виробничого розрахунку включав кілька завдань постобробки. Команда відфільтрувала результати класифікації культур за цільовими округами, виключивши всі нецільові культури та зберігши лише бавовну. Потім ці результати були векторизовані та об’єднані з даними виявлення меж поля. Потім вони обчислили площу кожного виявленого поля бавовни в цільових округах і виконали розрахунки виробництва для кожного поля відповідно до попередньо описаної методології.
Останнім кроком була підготовка остаточних векторних шарів, створення карт візуалізації та складання проєктного звіту.
Сама модель не є унікальною, але кількість і якість предикторів відрізняється у різних компаній. Дані, які використовуються для побудови зв’язку моделі з нашим цільовим прогнозованим значенням врожайності, відрізняються в кожному випадку.
Результати: Точність У Прогнозування Врожайності Бавовни
У проєктному звіті показано візуалізацію результатів, що також можна побачити на зображеннях нижче.


Точність тестової вибірки становила близько 80%, і її оцінювали за допомогою підходу перехресної перевірки. Цей рівень точності можна вважати задовільним для моделей оцінки та прогнозування врожайності. Проєкт довів, що EOS Data Analytics автоматизує процеси машинного навчання та штучного інтелекту, заощаджуючи час і ресурси, які зазвичай витрачаються на ручний збір і аналіз даних. Це допомагає нашим партнерам залишатися конкурентоспроможними на товарному ринку.
Є певні перспективи й для масштабування моделі. Використовуваний підхід можна розширити до більших областей, якщо необхідно, або зменшити за допомогою відповідного обсягу даних. Чим більше предикторів використовує модель, тим точнішою вона стає. Наприклад, додавання температури, відносної вологості ґрунту, загального або ґрунтового виробництва, загальних потреб у воді та споживання лише підвищить точність моделі прогнозування врожайності.
Хоча біофізичне моделювання та асиміляція таких супутникових даних, як WOFOST, не використовувалися в цьому проєкті, включення таких моделей може стати майбутнім кроком для підвищення точності та служити додатковим предиктором для оцінки врожайності.
Ми є компанією, що надає супутникові дані, тому в цій моделі ми також можемо використовувати середні індекси рослинності, наприклад нормалізований диференційний вегетаційний індекс, індекс листкової поверхні або нормалізований диференційний індекс вологості. Доступ до цих індексів можна отримати лише згори, з аналітики супутникових зображень.
Оцінка врожайності бавовни справді можлива в Техасі, як доводить ця історія. Фермери та агробізнеси можуть легко прогнозувати рівень врожаю за допомогою таких послуг, як Прогнозування Врожайності Сільськогосподарських Культур. Перспективи розробки цієї моделі величезні, тому нашій команді не терпиться випробувати їх усі.
Про автора:
Ксенія Кунах має понад 6 років досвіду написання текстів, працюючи в різних сферах, включаючи бізнес, освіту та медіа-тексти. Попередній досвід Ксенії як менеджерки з розвитку в українській еко-НУО та менеджерки з підбору персоналу в ІТ-компанії робить її ідеальним поєднанням людини, яка захоплюється еко-технологічними інноваціями та вміє легко про них розповідати.
Oстанні статті

Нор-Ест Агро Визначає Продуктивність Через Супутники
Українська Нор-Ест Агро використовує вегетаційні індекси та погодну аналітику в EOSDA Crop Monitoring для визначення ефективності комплексних рішень на полях партнерів.

Пероноспороз: Як Розпізнати, Запобігти Та Боротися
Пероноспороз — агресивна хвороба, що загрожує врожаям. Вчасне виявлення і продумана профілактика допоможуть зберегти посіви та підвищити економічну стабільність агробізнесу.

Фузаріоз: Як Запобігти Та Контролювати Поширення
Спори фузаріозу можуть зберігатися в ґрунті й заражати культури, що робить його постійною проблемою в сільському господарстві. Захистіть ваші посіви, дізнавшись про методи боротьби з патогеном.