Глубокие нейронные сети ускоряют моделирование погоды и климата

«Он описывает все, что вы видите за окном», – сказал Цзяли Ван, ученый-эколог из U.S. Аргоннская национальная лаборатория Министерства энергетики (DOE): «От облаков до солнечного излучения, от снега до растительности – даже то, как небоскребы мешают ветру."
Множество характеристик и причин погоды и климата взаимосвязаны и взаимодействуют друг с другом.

Ученым еще предстоит полностью описать эти сложные взаимосвязи простыми унифицированными уравнениями. Вместо этого они аппроксимируют уравнения, используя метод, называемый параметризацией, в котором они моделируют отношения в масштабе, превышающем масштаб реальных явлений.
Хотя параметризация упрощает физику таким образом, что позволяет моделям давать относительно точные результаты за разумное время, они по-прежнему являются дорогостоящими в вычислительном отношении.

Ученые-экологи и ученые-вычислители из Аргонны совместно используют глубокие нейронные сети, тип машинного обучения, чтобы заменить параметризацию определенных физических схем в модели WRF, что значительно сокращает время моделирования.
«С помощью менее дорогих моделей мы можем добиться моделирования с более высоким разрешением, чтобы предсказать, как краткосрочные и долгосрочные изменения погодных условий влияют на местный масштаб», – сказал Ван, – «вплоть до районов или конкретной критически важной инфраструктуры."
В недавнем исследовании ученые сосредоточились на планетном пограничном слое (PBL) или самой нижней части атмосферы. PBL – это атмосферный слой, на который деятельность человека влияет больше всего, и он простирается всего на несколько сотен метров над поверхностью Земли.

Динамика в этом слое, такая как скорость ветра, профили температуры и влажности, имеют решающее значение для определения многих физических процессов в остальной части атмосферы и на Земле.

PBL – важный компонент модели WRF, но он также является одним из наименее дорогостоящих в вычислительном отношении.

Это делает его отличным испытательным стендом для изучения того, как более сложные компоненты могут быть улучшены с помощью нейронных сетей глубокого обучения таким же образом.
«Мы использовали данные, полученные за 20 лет компьютерной модели WRF для обучения нейронных сетей, и данные за два года, чтобы оценить, могут ли они предоставить точную альтернативу параметризации, основанной на физике», – сказала Прасанна Балапракаш, ученый-компьютерщик и Министерство энергетики. Обладатель премии Early Career Award в отделе математики и информатики Аргонна и в Argonne Leadership Computing Facility (ALCF), пользовательском центре Управления науки Министерства энергетики США.

Балапракаш разработал нейронную сеть и обучил ее изучать абстрактную взаимосвязь между входами и выходами, передавая ей более 10 000 точек данных (8 в день) из двух мест, одного в Канзасе, а другого на Аляске. Результатом стал алгоритм, который, как уверены ученые, может заменить параметризацию PBL в модели WRF.
Ученые продемонстрировали, что глубокая нейронная сеть, которая учитывает некоторую базовую структуру взаимосвязи между входными и выходными переменными, может успешно моделировать скорость ветра, температуру и водяной пар с течением времени.

Результаты также показывают, что обученная нейронная сеть из одного места может предсказывать поведение в близлежащих местах с корреляцией выше 90 процентов по сравнению с тестовыми данными.
«Сотрудничество между климатологами и компьютерными учеными имело решающее значение для результатов, которых мы достигли», – сказал Рао Котамарти, главный научный сотрудник и руководитель отдела атмосферных исследований и климатических исследований в Аргоннском отделе наук об окружающей среде. "Использование наших знаний в предметной области делает алгоритм более предсказуемым."

Алгоритмы, называемые нейронными сетями с учетом предметной области, которые учитывают известные взаимосвязи, могут не только более точно предсказывать данные об окружающей среде, но также требуют обучения значительно меньшего объема данных, чем алгоритмы, не учитывающие знания предметной области.

Любой проект машинного обучения требует большого количества высококачественных данных, и в этом исследовании недостатка в данных не было. Ресурсы суперкомпьютеров в ALCF и Национальном научном вычислительном центре энергетических исследований, Управлении научных исследований Министерства энергетики США в Национальной лаборатории Лоуренса Беркли, способствовали производству данных за более чем 300 лет (700 терабайт), описывающих прошлую, настоящую и будущую погоду и климат в Северной Америке.
«Эта база данных уникальна для науки о климате в Аргонне, – сказал Ван, – и мы используем ее для проведения дальнейших исследований в области глубокого обучения и определения того, как ее можно применить к моделям климата."

Конечная цель ученых – заменить все дорогостоящие параметризации в модели WRF нейронными сетями с глубоким обучением, чтобы обеспечить более быстрое моделирование с более высоким разрешением.
В настоящее время команда работает над эмуляцией параметризации длинноволнового и коротковолнового солнечного излучения – двух частей модели WRF, которые вместе занимают почти 40% времени расчета физики в симуляциях.