Основные препятствия на пути увеличения масштабов хранения данных ДНК

«Системы ДНК привлекательны из-за их потенциальной плотности хранения информации; теоретически они могут хранить в миллиард раз больше данных, хранящихся в обычном электронном устройстве сопоставимого размера», – говорит Джеймс Так, соавтор статьи о работе и доцент кафедры электротехники и вычислительной техники в NC State.
"Но две большие проблемы здесь заключаются в том, как идентифицировать нити ДНК, которые содержат файл, который вы ищете? И как только вы определите эти пряди, как вы удалите их, чтобы их можно было прочесть – и сделать это, не разрушая пряди?"
«В предыдущей работе была разработана система, которая присоединяет короткие 20-мономерные последовательности ДНК, называемые последовательностями, связывающими праймер, к концам цепей ДНК, хранящих информацию», – говорит Альберт Кеунг, соавтор статьи и автор статьи. доцент кафедры химической и биомолекулярной инженерии в NC State. "Вы можете использовать небольшой праймер ДНК, который соответствует соответствующей последовательности связывания праймера, чтобы идентифицировать соответствующие цепи, которые составляют желаемый файл. Однако доступно только 30 000 таких связывающих последовательностей, что недостаточно для практического использования.

Мы хотели найти способ преодолеть это ограничение."
Чтобы решить эти проблемы, исследователи разработали два метода, которые, вместе взятые, они называют обогащением ДНК и вложенным разделением, или DENSe.

Исследователи решили проблему идентификации файлов с помощью двух вложенных последовательностей связывания праймеров. Система сначала идентифицирует все нити, содержащие исходную связующую последовательность. Затем он выполняет второй «поиск» этого подмножества нитей, чтобы выделить те нити, которые содержат вторую связующую последовательность.

«Это увеличивает количество предполагаемых имен файлов с примерно 30 000 до примерно 900 миллионов», – говорит Так.
После идентификации файл все еще необходимо извлечь. Существующие методы используют полимеразную цепную реакцию (ПЦР) для создания партий (и партий) копий соответствующих цепей ДНК, а затем секвенирования всего образца.

Поскольку существует так много копий целевых цепей ДНК, их сигнал подавляет остальные цепочки в образце, что позволяет идентифицировать целевую последовательность ДНК и читать файл.
«Этот метод неэффективен, и он не работает, если вы пытаетесь получить данные из базы данных большого объема – в системе слишком много другой ДНК», – говорит Кайл Томек, доктор философии.D. студент NC State и соавтор статьи.
Поэтому исследователи применили другой подход к извлечению данных, прикрепив любой из нескольких небольших молекулярных тегов к праймерам, используемым для идентификации целевых цепей ДНК. Когда праймер находит целевую ДНК, он использует ПЦР для создания копии соответствующей ДНК – и эта копия прикрепляется к молекулярной метке.

Исследователи также использовали магнитные микрошарики, покрытые молекулами, которые специфически связываются с заданной меткой. Эти функционализированные микрогранулы «захватывают» метки целевых цепей ДНК. Затем микрогранулы можно извлечь с помощью магнита, взяв с собой целевую ДНК.

«Эта система позволяет нам извлекать нити ДНК, связанные с конкретным файлом, без необходимости делать множество копий каждой нити, при этом сохраняя исходные нити ДНК в базе данных», – говорит Кеунг.

«Мы экспериментально реализовали систему DENSe, используя образцы файлов, и продемонстрировали, что ее можно использовать для хранения и извлечения текстовых файлов и файлов изображений», – добавляет Кеунг.
«Эти методы, когда используются в тандеме, открывают двери для разработки систем хранения данных на основе ДНК с современными возможностями и возможностями доступа к файлам», – говорит Томек.

«Следующие шаги включают масштабирование и тестирование подхода DENSe с более крупными базами данных», – говорит Так. "Большая проблема – цена."
Статья «Повышение масштабируемости систем хранения информации на основе ДНК» опубликована в журнале ACS Synthetic Biology. Со-ведущим автором статьи является Кевин Фолькель, доктор философии.D. студент NC State. Соавтором статьи является Александр Симпсон, бывший аспирант NC State; и Остин Хасс и Элейн Индермор, оба студентки NC State.

Работа выполнена при поддержке Национального научного фонда по гранту № 1650148.