ИИ изучает язык химии, чтобы предсказывать, как делать лекарства

Основная задача в области открытия лекарств и материаловедения – найти способы создания сложных органических молекул путем химического соединения более простых строительных блоков. Проблема в том, что эти строительные блоки часто реагируют неожиданным образом.
«Создание молекул часто описывается как искусство, реализуемое методом проб и ошибок, потому что наше понимание химической реакционной способности далеко от полного», – сказал д-р Альфа Ли из Кэвендишской лаборатории Кембриджа, который руководил исследованиями. "Алгоритмы машинного обучения могут лучше понимать химию, потому что они извлекают образцы реактивности из миллионов опубликованных химических реакций, что не может сделать химик."
Алгоритм, разработанный Ли и его группой, использует инструменты распознавания образов для распознавания того, как реагируют химические группы в молекулах, путем обучения модели на миллионах реакций, опубликованных в патентах.

Исследователи рассматривали предсказание химических реакций как проблему машинного перевода. Реагирующие молекулы рассматриваются как один «язык», а продукт – как другой язык. Затем модель использует шаблоны в тексте, чтобы научиться «переводить» между двумя языками.

Используя этот подход, модель достигает 90% точности в предсказании правильного продукта невидимых химических реакций, тогда как точность обученных химиков составляет около 80%. Исследователи говорят, что модель достаточно точна, чтобы обнаруживать ошибки в данных и правильно предсказывать множество сложных реакций.

Модель также знает то, чего не знает. Он дает оценку неопределенности, которая устраняет неверные прогнозы с точностью 89%.

Поскольку эксперименты отнимают много времени, точное прогнозирование имеет решающее значение, чтобы избежать использования дорогостоящих экспериментальных методов, которые в конечном итоге заканчиваются неудачей.
Во втором исследовании Ли и его группа в сотрудничестве с биофармацевтической компанией Pfizer продемонстрировали практический потенциал этого метода в открытии новых лекарств.
Исследователи показали, что при обучении на опубликованных исследованиях химии модель может делать точные прогнозы реакций на основе лабораторных журналов, показывая, что модель усвоила правила химии и может применять их к настройкам поиска лекарств.

Команда также показала, что модель может предсказывать последовательность реакций, которые приведут к желаемому продукту. Они применили эту методологию к различным молекулам, подобным лекарствам, показывая, что шаги, которые она предсказывает, являются химически разумными.

Эта технология может значительно сократить время доклинического открытия лекарств, поскольку она дает химикам-медикам план, с чего начать.
«Наша платформа похожа на GPS-навигатор для химии», – сказал Ли, который также является научным сотрудником в колледже Святой Катерины. "Он информирует химиков, является ли реакция успешной или нет, и как ориентироваться в маршрутах реакции, чтобы создать новую молекулу."
Кембриджские исследователи в настоящее время используют эту технологию прогнозирования реакций для разработки полной платформы, которая соединяет цикл разработки-изготовления-тестирования при открытии лекарств и открытии материалов: прогнозирование многообещающих биоактивных молекул, способы создания этих сложных органических молекул и выбор экспериментов, которые можно использовать. самый информативный. В настоящее время исследователи работают над извлечением химической информации из этой модели, пытаясь понять, что она узнала из того, что люди не узнали.

«Мы потенциально можем добиться большого прогресса в химии, если узнаем, какие типы закономерностей рассматривает модель, чтобы сделать прогноз», – сказал Питер Болгар, аспирант по синтетической органической химии, участвовавший в обоих исследованиях. "Модель и химики-люди вместе станут чрезвычайно влиятельными в разработке экспериментов, больше, чем каждый без другого."
Исследование было поддержано Программой Винтона по физике устойчивости и Фондом Герчела Смита.