Новый подход машинного обучения лучше определяет ферментативные металлы в белках

Но впечатляющая статистика Магомеса бледнеет по сравнению с точностью MAHOMES или Metal Activity Heuristic of Metalloprotein and Enzymatic Sites, модели машинного обучения, разработанной в Канзасском университете и названной в честь квотербека, которая может привести к более эффективной работе. , экологически чистые и дешевые лекарственные препараты и другие промышленные товары.
Вместо того, чтобы нацеливаться на широкие приемники, MAHOMES различает ферментативные и неферментативные металлы в белках с точностью 92.2%. Команда KU недавно опубликовала результаты этого подхода машинного обучения к дифференциации ферментов в Nature Communications.

«Ферменты – это супер интересные белки, которые выполняют всю химию – фермент вступает в химическую реакцию с чем-то, чтобы преобразовать это из одного в другое», – сказала автор-корреспондент Джоанна Слуски, доцент кафедры молекулярной биологии и вычислительной биологии в KU. "Все, что вы приносите в свое тело, ваше тело расщепляет и превращает в новые вещи, и этот процесс разрушения и превращения в новые вещи – все это благодаря ферментам."
Слуски и его соавторы-аспиранты Райан Фихан (фанат Chiefs по имени МАХОМС) и Меган Франклин из Центра вычислительной биологии Университета штата Калифорния стремились использовать компьютеры, чтобы различать металлопротеины, которые не проводят химические реакции, и металлоферменты, которые облегчить химические реакции с удивительной мощностью и эффективностью.
Проблема в том, что металлопротеины и металлоферменты во многом идентичны.

«Люди точно не знают, как работают ферменты», – сказал Слуски. «Для любого данного фермента вы можете сказать:« Хорошо, вы знаете, он отбирает этот водород и ставит группу -ОН »или что он делает.

Но если бы я дал вам белок, которого вы никогда раньше не видели, и спросил бы: «Какой конец?? С какой стороны это реакция?,’вы, как ученый и даже как энзимолог, наверное, не могли бы мне сказать.

Одним из ключевых моментов является то, что около 40% всех ферментов используют металлы для катализа, поэтому их белок связывает металл, а затем все, что изменяется, попадает в этот активный центр и изменяется. Мы рассматриваем эти связывающие металлы белки и металлоферменты, которые являются ферментами, связывающими металлы, как огромную возможность для нас, потому что моя лаборатория интересуется машинным обучением, которое может действительно хорошо отличать сайты ферментов от аналогичных, но неферментативных сайтов."
Еще во время учебы в университете Фихан начал собирать крупнейший в мире набор структурных данных о ферментативных и неферментативных сайтах металлопротеинов – работа, которая продолжалась в его карьере аспиранта.

Затем он сделал набор данных бесплатным для других исследователей на Github.
«Структурные данные получить очень сложно», – сказал Слуски. "Но если вам интересно, что такое физика и химия, и где находятся эти атомы, и что они могут делать в рамках этих отношений, вам нужны белковые структуры.

Сложной частью этого было получение множества структур ферментных сайтов, зная, что они являются ферментными сайтами, затем получение группы неферментных сайтов, которые связывают металлы – и зная, что они не являются ферментами – и извлечение их из большой структурной база данных."
Фихан смог найти тысячи уникальных активных и неактивных участков связывания металлов, а затем протестировал подходы машинного обучения, чтобы различать эти два. Для этого Фихан и Франклин обучили модель компьютерного обучения (MAHOMES), чтобы исследовать расщелину в белке и предсказать, может ли эта расщелина заниматься химией (то есть это был фермент). Изучив физико-химические характеристики, МАХОМЕС достиг 92.Точность 2% и 90.1% запоминает, когда различал активные и неактивные сайты.

Слуски сказал, что этот подход может стать важным шагом к тому, чтобы сделать ферменты более полезными для производства жизненно важных лекарственных препаратов и множества других промышленных процессов. Действительно, подход, впервые примененный командой KU, может произвести революцию в том, как создаются ферменты.
«Я надеюсь, что это изменит синтез в целом», – сказала она. "Я надеюсь, что появятся более дешевые лекарства, которые будут иметь меньшее влияние на окружающую среду.

Прямо сейчас синтез фармацевтических компаний имеет огромные экологические последствия, и было бы здорово, если бы мы могли снизить их. Но синтез есть вообще в каждой отрасли. Если вы хотите сделать краску, краска нуждается в синтезе.

Все сделано из химикатов – например, текстиль. Вы можете собирать хлопок, но в конечном итоге вы придадите этому хлопку определенные свойства материала, прежде чем продавать его, а для этого требуются химикаты. Чем больше мы сможем синтезировать с помощью ферментов и чем легче мы сможем сделать так, чтобы компании могли осуществлять этот синтез с помощью ферментов, тем дешевле он будет и тем экологичнее."

По словам Слуски, исследования машинного обучения будут продолжаться по трем направлениям.
«Во-первых, мы пытаемся улучшить работу машинного обучения», – сказала она. "Номер два, мы начинаем с его помощью разрабатывать ферменты. И номер три: мы хотим сделать это для ферментов, которые не связывают металлы.

Сорок процентов всех активных центров ферментов связаны с металлами. Давайте сделаем и остальные 60% – и поиск правильного набора для сравнения для остальных 60% – это проект, над которым работает другой аспирант в моей лаборатории."