Искусственный интеллект ускоряет разработку чистой, практически безграничной термоядерной энергии

Многообещающая новая глава в исследованиях термоядерного синтеза
«Это исследование открывает новую многообещающую главу в усилиях по доставке неограниченного количества энергии на Землю», – сказал Стив Коули, директор PPPL, о результатах, о которых сообщается в текущем выпуске журнала Nature. "Искусственный интеллект стремительно набирает обороты в науках, и теперь он начинает вносить свой вклад во всемирные поиски термоядерной энергии."
Термоядерный синтез, приводящий в движение солнце и звезды, представляет собой сплавление легких элементов в форме плазмы – горячего заряженного состояния вещества, состоящего из свободных электронов и атомных ядер, – которое генерирует энергию. Ученые стремятся воспроизвести термоядерный синтез на Земле для получения обильного источника энергии для производства электричества.
Решающее значение для демонстрации способности глубокого обучения прогнозировать сбои – внезапную потерю удержания частиц плазмы и энергии – имел доступ к огромным базам данных, предоставленным двумя основными термоядерными установками: Национальным центром термоядерного синтеза DIII-D, для которого работает General Atomics.

Министерство энергетики в Калифорнии, крупнейшее предприятие в США, и Joint European Torus (JET) в Соединенном Королевстве, крупнейшее предприятие в мире, которым управляет EUROfusion, Европейский консорциум по развитию термоядерной энергии. Поддержка ученых из JET и DIII-D сыграла важную роль в этой работе.

Обширные базы данных позволили надежно прогнозировать сбои на токамаках, отличных от тех, на которых система была обучена – в данном случае от меньшего DIII-D до более крупного JET. Это достижение служит хорошим предзнаменованием для прогнозирования сбоев на ИТЭР, гораздо более крупном и мощном токамаке, который должен будет применить возможности, полученные на современных термоядерных установках.

Код глубокого обучения, называемый рекуррентной нейронной сетью Fusion (FRNN), также открывает возможные пути для управления и прогнозирования сбоев.
Самая интригующая область научного роста
«Искусственный интеллект – это самая интригующая область научного развития прямо сейчас, и объединить его с наукой о синтезе очень интересно», – сказал Билл Танг, главный физик-исследователь PPPL, соавтор статьи и лектор в звании и звании профессора. на факультете астрофизических наук Принстонского университета, который курирует проект ИИ. "Мы увеличили способность предсказывать с высокой точностью наиболее опасные проблемы для чистой термоядерной энергии."

В отличие от традиционного программного обеспечения, которое выполняет предписанные инструкции, глубокое обучение учится на своих ошибках. Эту кажущуюся магию выполняют нейронные сети, слои взаимосвязанных узлов – математические алгоритмы, – которые "параметризуются" или взвешиваются программой для формирования желаемого результата.

Для любого заданного входа узлы стремятся произвести определенный выход, такой как правильная идентификация лица или точные прогнозы нарушения. Обучение начинается, когда узел не может выполнить эту задачу: веса автоматически корректируются для свежих данных, пока не будет получен правильный результат.

Ключевой особенностью глубокого обучения является его способность захватывать многомерные, а не одномерные данные. Например, в то время как программное обеспечение без глубокого обучения может учитывать температуру плазмы в определенный момент времени, FRNN рассматривает профили температуры, развивающиеся во времени и пространстве. «Способность методов глубокого обучения учиться на таких сложных данных делает их идеальным кандидатом для задачи прогнозирования сбоев», – сказал соавтор Джулиан Кейтс-Харбек, аспирант по физике Гарвардского университета и выпускник Департамента науки и науки Министерства энергетики США.

Сотрудник, который был ведущим автором статьи о природе и главным разработчиком кода.

Обучение и запуск нейронных сетей основаны на графических процессорах (GPU), компьютерных микросхемах, впервые разработанных для рендеринга 3D-изображений. Такие чипы идеально подходят для запуска приложений глубокого обучения и широко используются компаниями для создания возможностей искусственного интеллекта, таких как понимание разговорной речи и наблюдение за дорожными условиями с помощью беспилотных автомобилей.
Кейтс-Харбек обучила код FRNN на более чем двух терабайтах (1012) данных, собранных из JET и DIII-D.

Запустив программное обеспечение на кластере современных графических процессоров Tiger Принстонского университета, команда разместила его на суперкомпьютере Titan в Leadership Computing Facility в Ок-Ридже, в пользовательском центре Министерства энергетики США и на других высокопроизводительных машинах.
Сложная задача

Распределение сети по множеству компьютеров было сложной задачей. «Обучение глубоких нейронных сетей – это вычислительно-интенсивная задача, которая требует задействования высокопроизводительных вычислительных кластеров», – сказал Алексей Святковский, соавтор статьи в Nature, который помог преобразовать алгоритмы в производственный код и сейчас работает в Microsoft. «Мы размещаем копию всей нашей нейронной сети на многих процессорах, чтобы добиться высокоэффективной параллельной обработки», – сказал он.
Программное обеспечение также продемонстрировало свою способность прогнозировать истинные сбои в течение 30 миллисекунд, которые потребуются ИТЭР, при одновременном сокращении количества ложных срабатываний. Код теперь приближается к требованию ИТЭР о 95% правильных прогнозах с менее чем 3% ложных срабатываний. В то время как исследователи говорят, что только живые экспериментальные операции могут продемонстрировать достоинства любого метода прогнозирования, в их статье отмечается, что большие архивные базы данных, используемые в прогнозах, «охватывают широкий спектр операционных сценариев и, таким образом, предоставляют важные доказательства относительно сильных сторон метода прогнозирования. методы, рассмотренные в этой статье."

От прогноза к контролю
Следующим шагом будет переход от прогноза к контролю сбоев. «Вместо того, чтобы прогнозировать сбои в последний момент и затем смягчать их, мы в идеале использовали бы будущие модели глубокого обучения, чтобы мягко направлять плазму в сторону от областей нестабильности с целью в первую очередь избежать большинства сбоев», – сказала Кейтс-Харбек.

Этот следующий шаг подчеркивает Майкл Царнсторфф, который недавно перешел с заместителя директора по исследованиям в PPPL на главного научного директора лаборатории. «Контроль будет иметь важное значение для токамаков после ИТЭР, в которых предотвращение сбоев будет важным требованием», – отметил Зарнсторфф.
Для перехода от точных прогнозов с использованием искусственного интеллекта к реалистичному контролю плазмы потребуется несколько дисциплин. «Мы объединим глубокое обучение с базовой физикой из первых принципов на высокопроизводительных компьютерах, чтобы сосредоточиться на реалистичных механизмах управления горящей плазмой», – сказал Танг. "Под контролем понимается знание того, какие" ручки "повернуть на токамаке, чтобы изменить условия и предотвратить сбои.

Это в наших глазах, и мы идем туда."
Поддержка этой работы осуществляется со стороны Программы стипендий для аспирантов по вычислительным наукам Министерства энергетики Управления науки Министерства энергетики и Национальной администрации по ядерной безопасности; из Института вычислительных наук и инженерии Принстонского университета (PICsiE); и из фондов лабораторных исследований и разработок, которые предоставляет PPPL.

Авторы выражают благодарность Биллу Вихсеру и Курту Хиллегасу за помощь в создании высокопроизводительных суперкомпьютеров из PICSciE; Джек Уэллс из компании Oak Ridge Leadership Computing Facility; Сатоши Мацуока и Рио Йоката из Токийского технологического института; и Том Гиббс из NVIDIA Corp.