Более разумные эксперименты для более быстрого открытия материалов: ученые создали новый алгоритм искусственного интеллекта для принятия решений об измерениях; автономный подход может произвести революцию в научных экспериментах

От Галилея и Ньютона до недавнего открытия гравитационных волн проведение научных экспериментов для понимания мира вокруг нас было движущей силой нашего технологического прогресса на протяжении сотен лет. Улучшение того, как исследователи проводят свои эксперименты, может иметь огромное влияние на то, как быстро эти эксперименты принесут применимые результаты для новых технологий.
За последние десятилетия исследователи ускорили свои эксперименты за счет автоматизации и постоянно расширяющегося ассортимента быстрых измерительных инструментов. Однако некоторые из наиболее интересных и важных научных задач, такие как создание улучшенных материалов для аккумуляторов для хранения энергии или новых квантовых материалов для новых типов компьютеров, по-прежнему требуют очень сложных и длительных экспериментов.

Создав новый алгоритм принятия решений как часть полностью автоматизированной экспериментальной установки, междисциплинарная группа из двух пользовательских объектов Управления науки Министерства энергетики Брукхейвена – Центра функциональных наноматериалов (CFN) и Национального источника синхротронного света II (NSLS- II) – и Центр продвинутой математики для приложений энергетических исследований (CAMERA) лаборатории Беркли предлагает возможность изучать эти проблемы более эффективным образом.
Проблема сложности

Целью многих экспериментов является получение знаний об изучаемом материале, и у ученых есть проверенный способ сделать это: они берут образец материала и измеряют, как он реагирует на изменения в окружающей среде.

Стандартный подход для ученых на пользовательских объектах, таких как NSLS-II и CFN, – это вручную сканировать измерения из данного эксперимента, чтобы определить следующую область, где они могут захотеть провести эксперимент.

Но доступ к высококачественным инструментам для определения характеристик материалов на этих объектах ограничен, поэтому время измерения дорого. У исследовательской группы может быть всего несколько дней, чтобы измерить свои материалы, поэтому им нужно максимально использовать каждое измерение.
«Ключ к достижению минимального количества измерений и максимального качества результирующей модели – это работать там, где неточности велики», – сказал Маркус Ноак, научный сотрудник CAMERA и ведущий автор исследования. «Проведение там измерений наиболее эффективно снизит общую неопределенность модели."
Как отметил Кевин Ягер, соавтор и ученый CFN: «Конечная цель – не только ускорить сбор данных, но и улучшить качество данных, которые мы собираем.

Я думаю об этом как о том, что экспериментаторы переключаются с микроменеджмента своего эксперимента на управление на более высоком уровне. Вместо того, чтобы решать, где проводить следующие измерения на образце, ученые могут вместо этого думать о большой картине, которую мы, как ученые, и пытаемся сделать."
«Этот новый подход является прикладным примером искусственного интеллекта», – сказал соавтор Масафуми Фукуто, ученый из NSLS-II. "Алгоритм принятия решений заменяет интуицию человека-экспериментатора и может сканировать данные и принимать разумные решения о том, как должен проходить эксперимент."
Больше информации за меньшие деньги?
На практике, прежде чем начать эксперимент, ученые определяют набор целей, которые они хотят получить в результате измерения.

Установив эти цели, алгоритм просматривает ранее измеренные данные, пока эксперимент продолжается, чтобы определить следующее измерение. В своем поиске лучшего следующего измерения алгоритм создает суррогатную модель данных, которая представляет собой обоснованное предположение о том, как материал будет вести себя на следующих возможных шагах, и вычисляет неопределенность – в основном, насколько он уверен в своих угадайте – для каждого возможного следующего шага. На основании этого он затем выбирает наиболее неопределенный вариант для следующего измерения.

Хитрость здесь в том, что выбирая наиболее неопределенный шаг для измерения следующим, алгоритм максимизирует объем знаний, которые он получает, выполняя это измерение. Алгоритм не только максимизирует получение информации во время измерения, он также определяет, когда следует завершить эксперимент, определяя момент, когда любые дополнительные измерения не приведут к дополнительным знаниям.

"Основная идея состоит в том, после кучи экспериментов, как можно автоматически выбрать следующий лучший вариант?"сказал Джеймс Сетиан, директор CAMERA и соавтор исследования. "Маркус построил мир, который строит приблизительную суррогатную модель на основе ваших предыдущих экспериментов и предлагает лучший или наиболее подходящий эксперимент для следующего."

Как мы сюда попали
Чтобы сделать автономные эксперименты реальностью, команде пришлось заняться тремя важными частями: автоматизация сбора данных, анализ в реальном времени и, конечно же, алгоритм принятия решений.
«Это захватывающая часть нашего сотрудничества», – сказал Фукуто. «Мы все предоставили для этого важную часть: команда CAMERA работала над алгоритмом принятия решений, Кевин из CFN разработал анализ данных в реальном времени, а мы в NSLS-II обеспечили автоматизацию измерений."
Команда впервые реализовала свой алгоритм принятия решений на канале комплексного рассеяния материалов (CMS) на NSLS-II, который CFN и NSLS-II работают в партнерстве.

Этот прибор предлагает ультраяркие рентгеновские лучи для изучения наноструктуры различных материалов. Как ведущий специалист по созданию лучевого тракта этого инструмента, Фукуто уже спроектировал его с учетом автоматизации. Линия пучка предлагает робота для замены образцов, автоматическое перемещение образца в различных направлениях и многие другие полезные инструменты для обеспечения быстрых измерений.

Вместе с анализом данных в реальном времени Ягером, луч – по замыслу – идеально подходил для первого «умного» эксперимента.
Первый «умный» эксперимент

Первый полностью автономный эксперимент, который выполнила команда, заключался в нанесении на карту периметра капли, где разделяются наночастицы, с использованием метода, называемого малоугловым рассеянием рентгеновских лучей на канале CMS. Во время малоуглового рассеяния рентгеновских лучей ученые направляют яркие рентгеновские лучи на образец, и, в зависимости от атомной или наноразмерной структуры образца, рентгеновские лучи отражаются в разных направлениях.

Затем ученые используют большой детектор для захвата рассеянных рентгеновских лучей и расчета свойств образца в освещенном месте. В этом первом эксперименте ученые сравнили стандартный подход к измерению образца с измерениями, сделанными, когда новый алгоритм принятия решений требовал снимков. Алгоритм смог идентифицировать область капли и сосредоточился на ее краях и внутренних частях, а не на фоне.
«После нашего собственного первоначального успеха мы хотели применить алгоритм еще больше, поэтому мы обратились к нескольким пользователям и предложили протестировать наш новый алгоритм на их научных проблемах», – сказал Ягер. «Они сказали« да », и с тех пор мы измеряли различные образцы.

Одним из самых интересных было исследование образца, который был изготовлен, чтобы содержать спектр различных типов материалов. Таким образом, вместо того, чтобы делать и измерять огромное количество образцов и, возможно, упустить интересную комбинацию, пользователь сделал один единственный образец, который включал все возможные комбинации.

Затем наш алгоритм смог эффективно изучить это огромное разнообразие комбинаций », – сказал он.
Что дальше?
После первых успешных экспериментов ученые планируют улучшить алгоритм и, следовательно, его ценность для научного сообщества.

Одна из их идей – сделать алгоритм «учитывающим физику», используя все, что уже известно об исследуемом материале, чтобы метод мог быть еще более эффективным. Еще одна разработка – использование алгоритма во время синтеза и обработки новых материалов, например, для понимания и оптимизации процессов, связанных с передовым производством, поскольку эти материалы используются в реальных устройствах. Команда также думает о более широкой картине и хочет перенести автономный метод на другие экспериментальные установки.
"Я думаю, что пользователи рассматривают лучи NSLS-II или микроскопы CFN как мощные инструменты определения характеристик.

Мы пытаемся превратить эти возможности в мощную лабораторию по обнаружению материалов », – сказал Фукуто.