Искусственный интеллект классифицирует взрывы сверхновых с беспрецедентной точностью: новый алгоритм машинного обучения, обученный только на реальных данных, классифицировал более 2300 сверхновых с точностью более 80%

Обучив модель машинного обучения классифицировать сверхновые на основе их видимых характеристик, астрономы смогли классифицировать реальные данные Pan-STARRS1 Medium Deep Survey для 2315 сверхновых с точностью 82% без использования спектров.
Астрономы разработали программу, которая классифицирует различные типы сверхновых на основе их кривых блеска или того, как их яркость меняется с течением времени. «У нас есть около 2500 сверхновых с кривыми блеска из обзора Pan-STARRS1 Medium Deep Survey, и из них 500 сверхновых со спектрами, которые можно использовать для классификации», – сказал Гриффин Хоссейнзаде, научный сотрудник CfA и ведущий автор первого исследования. двух статей, опубликованных в The Astrophysical Journal. «Мы обучили классификатор, используя эти 500 сверхновых, чтобы классифицировать оставшиеся сверхновые, спектр которых мы не могли наблюдать."

Эдо Бергер, астроном из CfA, объяснил, что, если просить искусственный интеллект ответить на конкретные вопросы, результаты становятся все более точными. "Машинное обучение ищет корреляцию с исходными 500 спектроскопическими метками. Мы просим его сравнить сверхновые в разных категориях: цвет, скорость эволюции или яркость. Подкрепляя его реальными существующими знаниями, он обеспечивает наивысшую точность, от 80 до 90 процентов."

Хотя это не первый проект машинного обучения для классификации сверхновых, это первый раз, когда астрономы получили доступ к реальному набору данных, достаточно большому для обучения классификатора сверхновых на основе искусственного интеллекта, что позволяет создавать алгоритмы машинного обучения без использование моделирования.
«Если вы построите смоделированную кривую блеска, это означает, что вы делаете предположение о том, как будут выглядеть сверхновые, и ваш классификатор затем изучит эти предположения», – сказал Хоссейнзаде. "Природа всегда будет создавать некоторые дополнительные сложности, которые вы не учли, а это означает, что ваш классификатор не будет работать с реальными данными так же хорошо, как с смоделированными данными. Поскольку мы использовали реальные данные для обучения наших классификаторов, это означает, что наша измеренная точность, вероятно, более репрезентативна для того, как наши классификаторы будут работать в других опросах.«Поскольку классификатор классифицирует сверхновые, – сказал Бергер, – мы сможем изучить их как ретроспективно, так и в режиме реального времени, чтобы выбрать наиболее интересные события для детального изучения.

Мы будем использовать алгоритм, чтобы помочь нам выбрать иголки, а также посмотреть на стог сена."
Проект имеет значение не только для архивных данных, но и для данных, которые будут собираться телескопами будущего.

Вера С. Ожидается, что обсерватория Рубин будет запущена в 2023 году и приведет к открытию миллионов новых сверхновых каждый год. Это создает как возможности, так и проблемы для астрофизиков, поскольку ограниченное время телескопа приводит к ограниченной спектральной классификации.
«Когда Обсерватория Рубин станет онлайн, это увеличит нашу скорость открытия сверхновых в 100 раз, но наши спектроскопические ресурсы не увеличатся», – сказала Эшли Виллар, младший научный сотрудник Саймонса Колумбийского университета и ведущий автор второй из двух статей. , добавив, что, хотя в настоящее время ежегодно обнаруживается около 10 000 сверхновых, ученые получают спектры только около 10 процентов этих объектов. "Если это так, это означает, что только 0.1% сверхновых, обнаруживаемых обсерваторией Рубин каждый год, будут получать спектроскопические метки.

Остальные 99.9 процентов данных будет невозможно использовать без таких методов, как наш."
В отличие от прошлых попыток, когда наборы данных и классификации были доступны только ограниченному числу астрономов, наборы данных из нового алгоритма машинного обучения будут общедоступными. Астрономы создали удобное и доступное программное обеспечение, а также опубликовали все данные Pan-STARRS1 Medium Deep Survey вместе с новыми классификациями для использования в других проектах.

Хоссейнзаде сказал: «Для нас было действительно важно, чтобы эти проекты были полезны для всего сообщества сверхновых, а не только для нашей группы. Есть так много проектов, которые можно выполнить с этими данными, что мы никогда не сможем выполнить их все самостоятельно."Эти проекты – открытые данные для открытой науки", – добавил Бергер."

Этот проект частично финансировался за счет гранта Национального научного фонда (NSF) и Гарвардской инициативы в области науки о данных (HDSI).