Расширенные энциклопедии элементов ДНК в геномах человека и мыши.
ДомДом > Новости > Расширенные энциклопедии элементов ДНК в геномах человека и мыши.

Расширенные энциклопедии элементов ДНК в геномах человека и мыши.

Jul 07, 2023

Nature, том 583, страницы 699–710 (2020 г.) Процитировать эту статью

86 тысяч доступов

658 цитат

328 Альтметрика

Подробности о метриках

Авторская поправка к этой статье была опубликована 26 апреля 2022 г.

Эта статья обновлена

Геномы человека и мыши содержат инструкции, которые определяют РНК и белки и управляют временем, величиной и клеточным контекстом их производства. Чтобы лучше описать эти элементы, фаза III проекта Энциклопедии элементов ДНК (ENCODE) расширила анализ клеточных и тканевых репертуаров транскрипции РНК, структуры и модификации хроматина, метилирования ДНК, образования петель хроматина и занятости факторами транскрипции и РНК- связывающие белки. Здесь мы суммируем эти усилия, в результате которых было получено 5992 новых экспериментальных набора данных, включая систематические определения развития плода мышей. Все данные доступны на портале данных ENCODE (https://www.encodeproject.org), включая данные фазы II ENCODE1 и Roadmap Epigenomics2. Мы разработали реестр из 926 535 человеческих и 339 815 мышиных кандидатов цис-регуляторных элементов, охватывающий 7,9 и 3,4% их соответствующих геномов, путем интеграции выбранных типов данных, связанных с регуляцией генов, и создали веб-сервер (SCREEN; http:// screen.encodeproject.org), чтобы обеспечить гибкий, определяемый пользователем доступ к этому ресурсу. В совокупности данные и реестр ENCODE предоставляют научному сообществу обширный ресурс, позволяющий лучше понять организацию и функции геномов человека и мыши.

Геном человека представляет собой обширное хранилище инструкций, закодированных в ДНК, которые считываются, интерпретируются и выполняются клеточными белками и механизмами РНК, обеспечивая разнообразные функции живых клеток и тканей. Проект ENCODE направлен на точное и всестороннее определение сегментов геномов человека и мыши, которые кодируют функциональные элементы1,3,4,5,6. Функционально функциональные элементы определяются как дискретные, линейно упорядоченные особенности последовательности, которые определяют молекулярные продукты (например, гены, кодирующие белки, или некодирующие РНК) или биохимические активности, играющие механистическую роль в регуляции генов или генома (например, промоторы или усилители транскрипции)5. . Начиная с пилотного проекта ENCODE в 2003 году (который был сосредоточен на определенном 1% последовательности генома человека4) и масштабирования всего генома на втором этапе производства, который начался в 20071 году, ENCODE применила ряд современных технологий. художественные анализы для идентификации вероятных функциональных элементов с возрастающей точностью в расширяющемся диапазоне клеточных и биологических контекстов. Чтобы извлечь выгоду из ценности лабораторной мыши Mus musculus как для сравнительного функционального геномного анализа, так и для моделирования биологии человека, в 20096 году был инициирован проект Mouse ENCODE более ограниченного масштаба. Сопровождающая Perspective7 обеспечивает дополнительный контекст для эволюции ENCODE. Проект и описывает, как данные ENCODE используются для освещения как основных биологических, так и биомедицинских вопросов, которые пересекаются со структурой и функцией генома.

Начиная с 2012 года как человеческие, так и мышиные проекты ENCODE инициировали программы по расширению и углублению своих усилий по обнаружению и аннотированию функциональных элементов, а также по систематизации производства, обработки и распространения данных ENCODE с целью расширения возможностей научного сообщества. Данные ENCODE послужили связующим звеном между последовательностью генома человека и ее применением в биомедицинских исследованиях благодаря как диапазону биологических и биохимических характеристик, охватываемых анализами ENCODE, так и широте и глубине, с которой эти анализы применялись в контексте клеток и тканей. . В настоящее время ENCODE расширила обе эти оси за счет (i) включения новых методов анализа, таких как локализация РНК-связывающих белков и образование петель в хроматине; (ii) увеличение глубины, на которой современные анализы, такие как иммунопреципитация и секвенирование хроматина транскрипционных факторов (ChIP-seq), исследуют эталонные клеточные линии; и (iii) сбор данных по значительно расширенному биологическому диапазону с упором на первичные клетки и ткани. Кроме того, ENCODE теперь включила и единообразно обработала существенные данные из проекта «Дорожная карта эпигеномики»2, которые соответствуют стандартам ENCODE (см. «Методы»).

1.64 throughout, and low otherwise./p>2,000 bp for TSS-distal). We defined TSSs as the 5′ ends of all basic transcripts annotated by GENCODE (V24 for human and M18 for mouse). A cCRE was assigned to one of five mutually exclusive groups on the basis of its state and TSS proximity (Box 1): TSS-overlapping with promoter-like signatures (PLS), TSS-proximal with enhancer-like signatures (pELS), TSS-distal with enhancer-like signatures (dELS), not TSS-overlapping and with high DNase and H3K4me3 signals only (DNase–H3K4me3), not TSS-overlapping and with high DNase and CTCF signals only (CTCF-only). Note that this set of seven states and five groups is defined across all biosamples, and therefore is cell-type agnostic. We next define cell type-specific state and group classifications./p>