Модели, которые проспективно проверяются на предмет новых результатов реакций и используются для улучшения понимания человеком, чтобы интерпретировать решения о химической реактивности, принимаемые такими моделями, чрезвычайно ограничены.
Новаторы из Университета Пердью представили блок-схемы химической реактивности, чтобы помочь химикам интерпретировать результаты реакций с использованием статистически надежных моделей машинного обучения, обученных на небольшом количестве реакций. Работа опубликована в Organic Letters.
«Разработка новых и быстрых реакций имеет важное значение для дизайна химической библиотеки при открытии лекарств», – сказал Горав Чопра, доцент кафедры аналитической и физической химии в Научном колледже Пердью. «Мы разработали новую, быструю и однокомпонентную реакцию (MCR) N-сульфонилиминов, которая использовалась в качестве репрезентативного случая для генерации обучающих данных для моделей машинного обучения, прогнозирования результатов реакции и тестирования новых реакций вслепую.
«Мы ожидаем, что эта работа проложит путь к изменению нынешней парадигмы за счет разработки точных, понятных человеку моделей машинного обучения для интерпретации результатов реакций, которые повысят творческий потенциал и эффективность людей-химиков в открытии новых химических реакций и улучшении трубопроводов органической и технологической химии."
Чопра сказал, что интерпретируемый человеком подход машинного обучения команды Purdue, представленный в виде блок-схем химической реактивности, может быть расширен для изучения реакционной способности любого MCR или любой химической реакции.
Для этого не требуется крупномасштабная робототехника, поскольку эти методы могут использоваться химиками при проведении скрининга реакций в своих лабораториях.
«Мы представляем первый отчет о структуре, объединяющей быстрые синтетические химические эксперименты и квантово-химические расчеты для понимания механизма реакции и интерпретируемые человеком статистически надежные модели машинного обучения для определения химических закономерностей для прогнозирования и экспериментального тестирования гетерогенной реакционной способности N-сульфонилиминов», – Чопра сказал.
Эта работа совпадает с другими инновациями и исследованиями лабораторий Чопры, члены команды которой работают с Управлением коммерциализации технологий Purdue Research Foundation, чтобы запатентовать многочисленные технологии.
«Беспрецедентное использование модели машинного обучения для создания блок-схем химической реактивности помогло нам понять реакционную способность традиционно используемых различных N-сульфонилиминов в MCR», – сказал Крупал Джетхава, научный сотрудник лаборатории Чопры, соавтор работы. «Мы считаем, что совместная работа с химиками-органиками и компьютерными химиками откроет новые возможности для решения сложных проблем химической реактивности для других реакций в будущем."
Чопра сказал, что исследователи Purdue надеются, что их работа проложит путь к тому, чтобы стать одним из многих примеров, которые продемонстрируют силу машинного обучения для разработки новой синтетической методологии для разработки лекарств и не только в будущем.
«В этой работе мы стремились сделать так, чтобы наша модель машинного обучения была легко понятна химикам, не очень разбирающимся в этой области», – сказал Джонатан Файн, бывший аспирант Purdue, соавтор работы. «Мы считаем, что эти модели могут использоваться не только для прогнозирования реакций, но и для лучшего понимания того, когда произойдет определенная реакция. Чтобы продемонстрировать это, мы использовали нашу модель, чтобы направить дополнительные субстраты, чтобы проверить, произойдет ли реакция."