Искусственный интеллект становится учеником на всю жизнь с новой структурой: новые технологии приближают ИИ к эффективной помощи армейским миссиям

Исследователи из Университета штата Северная Каролина, финансируемые армией, также продемонстрировали, что использование фреймворка для изучения новой задачи может улучшить выполнение ИИ предыдущих задач – явление, называемое обратным переносом.
«Армия должна быть готова к сражению в любой точке мира, поэтому ее интеллектуальные системы также должны быть подготовлены», – сказал д-р.

Мэри Энн Филдс, руководитель программы интеллектуальных систем в Исследовательском бюро армии, член U.S. Лаборатория армейских исследований командования по развитию боевых возможностей армии. «Мы ожидаем, что интеллектуальные системы армии будут постоянно приобретать новые навыки, когда они проводят миссии на полях сражений по всему миру, не забывая о навыках, которые уже были обучены.

Например, при выполнении городских операций колесный робот может изучать новые параметры навигации для плотных городских городов, но ему все равно необходимо эффективно работать в ранее встречавшейся среде, такой как лес."
Исследовательская группа предложила новую структуру под названием Learn to Grow для непрерывного обучения, которая разделяет изучение сетевой структуры и изучение параметров модели.

В экспериментальном тестировании он превзошел прежние подходы к непрерывному обучению.
«Глубокие нейросетевые системы искусственного интеллекта предназначены для изучения узких задач», – сказал Силай Ли, соавтор статьи и доктор наук.D. кандидат в NC State. «В результате при изучении новых задач может произойти одно из нескольких: системы могут забыть старые задачи при изучении новых, что называется катастрофическим забыванием.

Системы могут забыть кое-что из того, что они знали о старых задачах, но при этом не научиться выполнять новые. Или системы могут исправлять старые задачи на месте, добавляя новые задачи, что ограничивает улучшения и быстро приводит к тому, что система искусственного интеллекта слишком велика, чтобы работать эффективно. Непрерывное обучение, также называемое непрерывным обучением или обучением для обучения, пытается решить эту проблему."
Чтобы понять структуру Learn to Grow, представьте глубокие нейронные сети как трубу, заполненную несколькими слоями.

Необработанные данные поступают в верхнюю часть конвейера, а выходные данные задачи выходят снизу. Каждый «слой» в конвейере – это вычисление, которое манипулирует данными, чтобы помочь сети выполнить свою задачу, такую ​​как идентификация объектов на цифровом изображении. Существует несколько способов размещения слоев в трубе, которые соответствуют разным «архитектурам» сети.

Когда вы просите глубокую нейронную сеть изучить новую задачу, структура Learn to Grow начинает с выполнения того, что называется явной оптимизацией нейронной архитектуры с помощью поиска.

Это означает, что по мере того, как сеть подходит к каждому уровню в своей системе, она может решить сделать одно из четырех: пропустить уровень; используйте слой так же, как и в предыдущих задачах; прикрепить к слою легкий переходник, который его немного видоизменяет; или создайте совершенно новый слой.
Эта оптимизация архитектуры эффективно определяет лучшую топологию или серию слоев, необходимых для выполнения новой задачи. Как только это будет выполнено, сеть использует новую топологию, чтобы обучиться тому, как выполнять задачу, как и любая другая система искусственного интеллекта с глубоким обучением.

«Мы провели эксперименты с использованием нескольких наборов данных и обнаружили, что чем больше похожа новая задача на предыдущие, тем больше перекрывается с точки зрения существующих слоев, которые сохраняются для выполнения новой задачи», Ли сказал. «Что более интересно, с оптимизированной – или« изученной »топологией – сеть, обученная выполнять новые задачи, очень мало забывает о том, что ей требовалось для выполнения старых задач, даже если старые задачи не были похожи."
Исследователи также провели эксперименты, сравнивая способность структуры Learn to Grow изучать новые задачи с несколькими другими методами непрерывного обучения, и обнаружили, что структура Learn to Grow имеет более высокую точность при выполнении новых задач.
Чтобы проверить, насколько каждая сеть могла забыть при изучении новой задачи, исследователи затем проверили точность каждой системы при выполнении более старых задач – и структура Learn to Grow снова превзошла другие сети.

«В некоторых случаях структура Learn to Grow действительно лучше справлялась со старыми задачами», – сказал Каймин Сюн, директор по исследованиям Salesforce Research и соавтор работы. "Это называется обратным переносом и происходит, когда вы обнаруживаете, что изучение новой задачи помогает вам лучше справляться со старой задачей. Мы все время видим это в людях; не так много с ИИ."
«Эти вложения в армию расширяют современные методы машинного обучения, которыми будут руководствоваться исследователи нашей исследовательской лаборатории армии при разработке роботизированных приложений, таких как интеллектуальное маневрирование и обучение распознаванию новых объектов», – сказал Филдс. "Это исследование приближает ИИ к обеспечению наших бойцов эффективных беспилотных систем, которые можно использовать в полевых условиях."

Документ «Учитесь расти: структура обучения с постоянной структурой для преодоления катастрофического забвения» будет представлен на 36-й Международной конференции по машинному обучению, которая состоится 9-15 июня в Лонг-Бич, Калифорния. Соавторами статьи являются Тяньфу Ву, Ph.D., доцент кафедры электротехники и вычислительной техники в NC State, Силай Ли, докторант в NC State, и Инбо Чжоу из Salesforce Research.

Соавторами статьи являются Ричард Сохер и Кайминг Сюн из Salesforce Research.
Работа также поддержана Национальным научным фондом.

Часть работы была сделана, когда Ли проходил летнюю стажировку в Salesforce AI Research.