Исследовательский консорциум, известный как ENCODE (Энциклопедия элементов ДНК), добился значительного прогресса в достижении этой цели, определив множество участков генома, которые связываются с регуляторными белками, помогая контролировать, какие гены включаются или выключаются. В новом исследовании, которое также является частью ENCODE, исследователи идентифицировали множество дополнительных сайтов, кодирующих молекулы РНК, которые могут влиять на экспрессию генов.
Эти последовательности РНК не транслируются в белки, но действуют различными способами, чтобы контролировать, сколько белка производится из генов, кодирующих белок. Исследовательская группа, в которую входят ученые из Массачусетского технологического института и нескольких других учреждений, использовала РНК-связывающие белки, чтобы помочь им найти и назначить возможные функции десяткам тысяч последовательностей генома.
«Это первый крупномасштабный функциональный геномный анализ РНК-связывающих белков с использованием множества различных методов», – говорит Кристофер Бердж, профессор биологии Массачусетского технологического института. «С технологиями изучения РНК-связывающих белков, которые сейчас приближаются к уровню тех, которые были доступны для изучения ДНК-связывающих белков, мы надеемся более полно привнести функцию РНК в мир генома."
Бердж является одним из главных авторов исследования, наряду с Сян-Донг Фу и Джин Йео из Калифорнийского университета в Сан-Диего, Эриком Лекуйером из Монреальского университета и Брентоном Грейвли из UConn Health.
Ведущими авторами исследования, которое сегодня публикуется в журнале Nature, являются Питер Фриз, недавно получивший докторскую степень в области вычислительной и системной биологии Массачусетского технологического института; Эрик Ван Ностранд, Габриэль Пратт и Руи Сяо из UCSD; Сяофэн Ван из Монреальского университета; и Синтао Вэй из UConn Health.
Регулирование РНК
Большая часть проекта ENCODE до сих пор основывалась на обнаружении регуляторных последовательностей ДНК с использованием метода под названием ChIP-seq.
Этот метод позволяет исследователям идентифицировать участки ДНК, которые связаны с ДНК-связывающими белками, такими как факторы транскрипции, помогая определить функции этих последовательностей ДНК.
Однако, как отмечает Бердж, этот метод не обнаруживает геномные элементы, которые необходимо скопировать в РНК, прежде чем участвовать в регуляции генов. Вместо этого команда разработчиков РНК полагалась на технику, известную как eCLIP, которая использует ультрафиолетовый свет для перекрестного связывания молекул РНК с РНК-связывающими белками (RBP) внутри клеток.
Затем исследователи выделяют определенные RBP с помощью антител и секвенируют РНК, с которыми они были связаны.
RBP выполняют множество различных функций – некоторые из них являются факторами сплайсинга, которые помогают вырезать участки матричной РНК, кодирующей белок, в то время как другие прекращают транскрипцию, усиливают трансляцию белка, разрушают РНК после трансляции или направляют РНК в определенное место в клетке. Определение последовательностей РНК, которые связаны с RBP, может помочь выявить информацию о функции этих молекул РНК.
«Сайты связывания RBP являются кандидатами в функциональные элементы транскриптома», – говорит Бердж. «Однако не все сайты связывания имеют определенную функцию, поэтому вам необходимо дополнить это другими типами анализов для оценки функции."
Исследователи выполнили eCLIP примерно для 150 RBP и объединили эти результаты с данными из другой серии экспериментов, в которых они подавили экспрессию примерно 260 RBP, по одной в клетках человека. Затем они измерили влияние этого нокдауна на молекулы РНК, которые взаимодействуют с белком.
Используя метод, разработанный лабораторией Берджа, исследователи также смогли более точно сузить, где RBP связываются с РНК.
Этот метод, известный как RNA Bind-N-Seq, выявляет очень короткие последовательности, иногда содержащие структурные мотивы, такие как выпуклости или шпильки, с которыми связываются RBP.
В целом, исследователи смогли изучить около 350 из 1500 известных человеческих RBP, используя один или несколько из этих методов для каждого белка. Факторы сплайсинга РНК часто имеют разную активность в зависимости от того, где они связываются в транскрипте, например, активируя сплайсинг, когда они связываются с одним концом интрона, и подавляя его, когда они связываются с другим концом.
Объединение данных этих методов позволило исследователям составить «атлас» карт, описывающих, как активность каждой RBP зависит от места привязки.
«Почему они активируются в одном месте и подавляют, когда привязываются к другому, – давняя загадка», – говорит Бердж. "Но наличие этого набора карт может помочь исследователям выяснить, какие особенности белка связаны с каждым паттерном активности."
Кроме того, группа Лекуйера из Монреальского университета использовала зеленый флуоресцентный белок, чтобы пометить более 300 RBP и определить их расположение в клетках, таких как ядро, цитоплазма или митохондрии. Эта информация о местоположении также может помочь ученым узнать больше о функциях каждой RBP и РНК, с которой она связывается.
Связывание РНК и болезни
Многие исследовательские лаборатории по всему миру в настоящее время используют эти данные, чтобы выявить связи между некоторыми из идентифицированных последовательностей РНК и заболеваниями человека. Для многих заболеваний исследователи определили генетические варианты, называемые однонуклеотидными полиморфизмами (SNP), которые чаще встречаются у людей с определенным заболеванием.
«Если они возникают в кодирующей белок области, вы можете предсказать их влияние на структуру и функцию белка, что происходит постоянно. Но если они возникают в некодируемой области, сложнее понять, что они могут делать », – говорит Бердж. «Если они попадают в некодирующую область, которую мы определили как связывающуюся с RBP, и нарушают мотив RBP, то мы можем предсказать, что SNP может изменить сплайсинг или стабильность гена."
Бердж и его коллеги теперь планируют использовать свои методы, основанные на РНК, для получения данных о дополнительных РНК-связывающих белках.
«Эта работа предоставляет ресурс, который сообщество генетиков человека может использовать для определения генетических вариантов, которые функционируют на уровне РНК», – говорит он.
Исследование финансировалось проектом ENCODE Национального института исследования генома человека, а также грантом фонда Fonds de Recherche de Quebec-Sante.