Резюме проекта

В связи с быстро меняющимися условиями морского льда в Беринговом море и Северном Ледовитом океане растет спрос на СЗП Аляски в более конкретной навигации по морскому льду для поддержки транспортной логистики, жизнеобеспечения, рыболовства и коммерческих интересов. Хотя в последние годы динамические сопряженные сезонные модели продемонстрировали лучшую точность прогнозирования информации о морском льду, руководство по-прежнему демонстрирует значительную погрешность и не содержит необходимой детализации, особенно у побережья, чтобы фиксировать воздействия на прибрежные районы.

Цель этого проекта заключалась в разработке метода предоставления вероятностной информации о концентрации морского льда на еженедельной основе в течение предстоящего 3–6-недельного периода времени, а также ежемесячных ориентировочных данных на период до 9 месяцев, полученных на основе данных о наличии сезонного морского льда. и динамические модели атмосферы.

Методология проекта

Обзор

Цель проекта состояла в том, чтобы разработать метод обеспечения ориентировки по морскому льду от 3-недельного до сезонного (S2S) для ряда предварительно определенных местоположений на основе исторических выходных данных оперативной системы прогнозирования климата NCEP версии 2 (CFSv2) в сочетании с экспериментальная модель морского льда (КМП).

Тренировочные данные

CFSv2 Experimental — это долгосрочная динамическая модель, которая прогнозирует ряд переменных относительно далеко в будущем, включая температуру воздуха, концентрацию льда и соленость. Исторические результаты моделирования сплоченности морского льда и температуры поверхности были взяты из модели за период с 2012 по 2020 год, чтобы обеспечить основу для разработки модели навигации по морскому льду. Временные ряды результатов модели в 315 точках интереса, определенных Национальной метеорологической службой, были извлечены из модели и сохранены в файлы netCDF.

Разработка модели

После построения и оценки ряда моделей на основе (S)ARIMA мы остановились на библиотеке прогнозирования временных рядов на основе GAM Prophet (Taylor and Letham, 2017). Было показано, что Пророк точен для временных рядов, в которых известна сезонность и по крайней мере несколько лет годовых данных. Это соответствовало потребностям данного проекта, в котором данные CFSv2 были получены примерно за 9 лет, а образование морского льда имеет сильную сезонность, основанную в основном на календарном году. Профет, как правило, прост в настройке и использовании, генерирует прогнозы на основе линейной логистической кривой, хорошо обрабатывает выбросы и отсутствующие данные и, как правило, намного быстрее обучается по сравнению с моделями (S)ARIMA.

По умолчанию Prophet просто использует исторические тенденции в одной переменной для моделирования будущих тенденций в этой переменной, и это модели, опубликованные на соответствующей странице github. Однако он также может включать один или несколько регрессоров (например, температуру воздуха) для управления будущей моделью. То есть, если есть долгосрочные прогнозы управляющих переменных (например, температуры воздуха, ветра и т. д.), но лед не моделировался, Пророка можно обучить прогнозировать значения льда на основе других переменных. Это может быть полезно в некоторых обстоятельствах, которые мы обсуждаем в оценочной части проекта.

Ежедневные точечные входные данные о морском льде показали характерный несезонный шум, который, по-видимому, способствовал нереалистичным тенденциям в выходных моделях. Мы сравнили модели пророков, созданные с использованием ежедневных и еженедельных входных данных и нескольких станций, и обнаружили, что использование еженедельных входных данных позволило создать модели, которые давали более реалистичные тенденции.

Оценка модели

Мы оценили соответствие моделей несколькими способами, и их можно найти в разделе Оценка этого сайта.

Данные, модели и выходные данные

Все данные, модели и результаты доступны на GitHub.

Оценка модели

Пакет Prophet Python имеет встроенный модуль диагностики, который позволяет пользователям оценивать горизонт предсказания по сравнению с входными данными из временного ряда для отдельной станции. Хотя результаты диагностики полезны, нас также интересовало, как модели сравниваются друг с другом в регионе. С этой целью мы создали серию блокнотов Jupyter на основе Python, в которых использовались среднеквадратичные ошибки, карты, визуальная проверка совпадений временных рядов и анализ переходов льда, чтобы понять, насколько хорошо подходят модели Prophet. входные данные, если существуют региональные тенденции к ошибкам, и степень ограничений модели. Результаты этих тетрадей суммированы здесь.

Насколько хорошо модель пророка соответствует извлеченным результатам из CFSv2e в заданных местоположениях?

Оценка подгонки через среднеквадратичные ошибки

Среднеквадратические ошибки сплоченности морского льда (RMSE) по каждой станции, полученные из горизонта перекрестной проверки в 365 дней на основе 8-летних обучающих данных, имели среднее значение 0,138, минимум 0,008 и максимум 0,434. . Станция с самым высоким средним значением RMSE (N73W145) имела среднее значение RMSE 0,26. Как правило, самая высокая ошибка соответствует разнице в фазе между ростом и отступлением льда и фазой, предсказанной моделью.

Насколько хорошо Prophet соответствует точкам перехода льда (лед внутри или снаружи)?

Мы просмотрели ряд станций, чтобы качественно определить, насколько хорошо Пророк смоделировал точки перегиба. Используя общий порог 15%, мы преобразовали результаты временных рядов станций в бинарную форму есть лед (верно) и нет льда (ложно), чтобы проверить, насколько хорошо модели воспроизводят время перехода льда.

Ярким примером такого анализа является станция PAOT (Коцебу), которая за последние девять лет имела только один переход от льда к выходу из льда каждый год.

В этом случае легко сравнить данные CFSv2 с моделью Prophet в Коцебу, чтобы найти среднюю ошибку отсутствия льда в 10,8 дней и среднюю ошибку образования льда в -5,3 дня. Модель Prophet была сгенерирована на основе еженедельных данных, поэтому она довольно хороша с точки зрения погрешности (1–2 точки данных).

Мы обработали данные, чтобы найти каждую станцию ​​в исследовании, которая показала один (и только один) переход от льда к отсутствию льда (и наоборот) в любой год их временного ряда. 178 из 300 станций имели четкие переходы от обледенения к обледенению, время которых можно было сравнить с полученным из модели Prophet. Включенные в эту подгруппу станции были широко распространены вдоль сезонной кромки льда, от северной оконечности исследуемого района в Чукотском море (76,9 с. ш.) до юга до мыса Ньюенхем (58,4 с. ш.).

Анализируя даты для всех моделей Prophet на этих станциях, мы обнаружили, что в среднем модель Prophet предсказывала даты перехода ото льда на 11,4 дня позже, чем входные данные CFSv2, а модель Prophet предсказывала даты таяния льда. переходы льда на 6,5 дней раньше, чем входы. То есть он постоянно показывал, что ледовый сезон наступил на неделю раньше и задержался на одну неделю дольше, чем входные данные. В этом анализе сравнивались 1245 переходов при отсутствии льда и 1132 переходов при обледенении (всего 2377).

  • Лед в средней разнице: -6,5 дней
  • Лед в средней абсолютной разнице: 8,4 дня
  • Средняя разница при выходе из льда: 11,4 дня.
  • Ice Out Средняя абсолютная разница: 12,5 дней

Какие станции лучше или хуже всего подходят?

Мы создали карту всех смоделированных станций, чтобы определить, присутствует ли пространственный компонент в точности модели. Районы в южной части Берингова моря имели ожидаемо низкие среднеквадратичные ошибки (RMSE), потому что морской лед лишь изредка проникает в эти регионы. Области в изменчивой области вблизи Берингова пролива имели средние значения RMSE, при этом область к западу от острова Св. Лаврентия демонстрировала наиболее подверженные ошибкам модели, а проливы Нортон и Коцебу были немного лучше. Модели у северного побережья Аляски в море Бофорта были смоделированы с удивительно низкими ошибками, тогда как в прибрежных районах значения RMSE были выше, возможно, из-за быстро меняющихся условий.

Мы проверили модели, созданные для отдельных точек, и следующие шесть графиков представляют выборку моделей по всему региону.

В целом более низкая сплоченность льда в целом (например, в Сент-Джордже) приводит к очень низким значениям среднеквадратичной ошибки. Это имеет смысл, но также предполагает, что RMSE следует использовать осторожно при сравнении моделей из разных областей. В приведенных выше случаях среднеквадратичная ошибка для моделей моря Бофорта имеет одни из лучших «выглядящих» моделей, за исключением 2020 года, когда в CFSv2 было больше льда, чем предсказывалось моделью Пророка. Между тем, острова Св. Лаврентия и Св. Мэтьюза показывают более низкие значения RMSE, но визуально хуже соответствуют входным значениям, намного превышающим предсказанные моделью Пророка. В частности, модель острова Св. Лаврентия значительно занижала количество льда, который там наблюдался.

Сколько лет данных/CFSv2e необходимо, чтобы получить «хорошие» результаты от модели пророка?

Модель «Пророк» работает лучше всего, если исходные данные по крайней мере за три года.

Добавление регрессоров

Насколько сильна связь между смоделированной температурой и смоделированным морским льдом?

Мы использовали переменные температуры поверхности и концентрации льда и построили график их зависимости друг от друга). Отдельные станции обычно показывают сильную связь между температурой и сплоченностью льда (например, PAOT, -162,60624 в.д., 66,88576 с.ш., недалеко от Коцебу).

Ради интереса мы построили двухмерную гистограмму всех 305 станций, чтобы определить, согласовывались ли отношения между температурой и концентрацией льда. Как и ожидалось, сплоченность льда связана с температурой поверхности, хотя эта зависимость становится более сложной по мере повышения температуры. При температуре -1,0°С почти каждое значение концентрации льда от 0,0 до 0,8 представлено в какой-то момент времени. Точно так же сплоченность льда, равная 0, может иметь место почти при любой температуре >1,5 C. Двухмерная гистограмма показывает, что типичная ошибка сплоченности льда +/- 0,3 может быть типичной ошибкой для прогнозов по всему региону. Но ошибки, основанные на моделях на отдельных станциях, могут быть значительно лучше.

Если мы добавим регрессоры для управления моделью пророка (например, температуру воздуха), как это изменит результаты и статистику?

Регрессоры используются для привязки прогнозов к одной или нескольким движущим переменным. Важно отметить, что если для обучения модели используются регрессоры, они должны предоставляться на протяжении прогнозируемого будущего. Например, если мы включим температуру поверхности в качестве движущей силы концентрации льда в Арктике, Prophet можно использовать для прогнозирования будущего только настолько далеко, насколько у нас есть прогнозы температуры. Это имеет смысл, но также может показаться несколько замкнутым. В этом случае мы обучили модель, основанную на CFSv2 с сплоченностью морского льда CPC. Если мы используем температуру поверхности CFSv2 для управления моделью и можем предсказывать будущее только в том, что касается CFSv2, сплоченность морского льда из модели Prophet становится избыточной по сравнению с результатом CFSv2 для сплоченности морского льда.

Ценность добавления регрессоров заключается в создании гораздо более точной физически управляемой модели для случая, когда регрессоры хорошо смоделированы, а прогнозируемая метрика — нет. Например, если бы у нас был долгосрочный прогноз температуры воздуха, который не включает лед, но метрики льда можно было бы обучить температуре по историческим спутниковым данным. В случае этого проекта мы создали модели (1), обученные только историческим значениям концентрации морского льда, и (2) с использованием температуры поверхности из CFSv2 в качестве регрессора, что было полезно для доказательства метода, но не дает дополнительных прогнозов. кроме CFSv2. Опубликованные модели включают только модели без регрессоров, поэтому их можно использовать для моделирования фьючерсов произвольной длины.

Обсуждение

В этом проекте мы сосредоточились на библиотеке прогнозирования временных рядов с открытым исходным кодом Prophet (Taylor and Letham, 2017). Было показано, что Пророк точен для временных рядов, в которых известна сезонность и по крайней мере несколько лет годовых данных. Это соответствовало потребностям данного проекта, в котором данные CFSv2 были получены примерно за 9 лет, а образование морского льда имеет сильную сезонность, основанную в основном на календарном году. Как правило, его легко настроить и использовать, он подходит для будущего на основе линейной логистической кривой и хорошо обрабатывает выбросы и отсутствующие данные.

Однако, как простая в использовании модель, Prophet также имеет некоторые недостатки. Во-первых, кажется, что он не очень хорошо предсказывает выпадающие годы, т. е. прогнозируемое будущее часто имеет реакцию, которая больше похожа на «нормальную», что иногда оправдано. Во-вторых, если выпадающие годы используются в течение последних трех лет обучения, они могут сильно повлиять на итоговое будущее. Например, зимние сезоны 2017–2018 и 2018–2019 гг. на станции BRST10 (Берингов пролив) были смоделированы CFSv2 как имеющие относительно низкую сплоченность льда, за которыми последовали две зимы, когда морской лед вернулся к более высоким значениям сплоченности, близким к «нормальному» тренду. . Первоначальный прогноз модели Пророка, который мы использовали (ежедневные данные без регрессоров), принял это возвращение к норме как признак того, что морской лед будет увеличиваться до бесконечности в будущем.

Наконец, хотя Пророк принимает значения несущей способности и минимумы насыщения (0 и 1 для сплоченности морского льда), модель позволяет делать прогнозы, выходящие далеко за пределы этих значений.

Полная модель доступна здесь: https://s2s.srv.axds.co/