Исследователи из Центра клеточных и биомолекулярных исследований Доннелли Университета Торонто обнаружили в геноме человека почти один миллион новых экзонов — участков ДНК, которые экспрессируются в зрелой РНК.
Результаты были опубликованы в журнале Genome Research .
У человека существует около 20 000 генов, кодирующих белки , которые содержат около 180 000 известных внутренних экзонов. Эти кодирующие белки регионы составляют лишь один процент всего генома человека . Подавляющее большинство того, что осталось, является загадкой, которую метко называют «темным геномом».
«Мы начали разрушать темный геном, обнаружив почти миллион ранее неизвестных экзонов с помощью метода, называемого захватом экзонов», — сказал Тимоти Хьюз, главный исследователь исследования, профессор и заведующий кафедрой молекулярной генетики Университета Калифорнии. Медицинский факультет Т. Темерти.
«Этот метод включает в себя анализ с плазмидами для поиска экзонов во фрагментах ДНК неизвестного состава», — сказал Хьюз, заведующий кафедрой канадских исследований по расшифровке регуляции генов и заведующим кафедрой медицинских исследований имени Джона Биллеса в Университете штата Теннесси. ловушка больше не используется широко, она доказала свою эффективность в сочетании с высокопроизводительным секвенированием для сканирования всего генома человека».
Экзоны — это сегменты генома, которые могут кодировать белки, управляющие развитием тканей и биологическими процессами в организме. Они считаются автономными, если им не требуется внешняя помощь для сращивания со зрелым транскриптом РНК, который затем транслируется в белок.
Команда, стоящая за исследованием, была вынуждена протестировать модель определения экзонов, которая направляет исследования в области молекулярной генетики, после того, как поставила под сомнение одно из ее предположений — что точному удалению некодирующих белок интронных областей генома способствуют четкие и последовательные индикаторы того, где они находятся. экзоны начинаются и заканчиваются. Это предположение, по-видимому, справедливо не во всех случаях, поскольку сплайсинг экзонов не всегда проходит гладко, что иногда приводит к образованию зрелых транскриптов РНК, содержащих нефункциональные компоненты.
«Почти ни один из недавно обнаруженных экзонов не встречается последовательно в геномах разных видов», — сказал Хьюз. «Похоже, что они появляются в человеческом геноме в основном из-за случайной мутации и вряд ли сыграют значительную роль в нашей биологии. геном».
Полезно документировать случайно мутировавшие экзоны в геноме человека, поскольку их трансляция потенциально может быть вредной. Длинные некодирующие экзоны РНК, которые автономны, но часто не имеют известной функции, связаны с развитием рака. Из примерно 1,25 миллиона известных и неизвестных экзонов, которые команда обнаружила с помощью захвата экзонов, почти четыре процента представляли собой длинные некодирующие экзоны РНК.
Кроме того, экзоны, находящиеся внутри некодирующих интронов, называемые псевдоэкзонами, могут мутировать, делая слабый сайт сплайсинга сильнее. Это приводит к включению экзона в зрелый транскрипт РНК, что потенциально может привести к заболеванию.
«Это интересное исследование, которое расширяет наши знания о последовательностях в геноме человека, которые потенциально могут быть распознаны как экзоны в транскрибируемой РНК», — сказал Бенджамин Бленкоу, профессор молекулярной генетики медицинского факультета Темерти Университета штата Техас, который не был участвует в исследовании.
«Хотя значение большинства вновь обнаруженных экзонов неясно, некоторые из них могут быть активированы в определенных контекстах, например, в результате мутаций заболевания, и поэтому их каталогизация важна. Это исследование в дальнейшем послужит ценным ресурсом, облегчающим текущие исследования. усилия, направленные на расшифровку кода сплайсинга».
Более глубокое понимание факторов, влияющих на включение экзонов в зрелую РНК, может помочь улучшить такие программы, как SpliceAI, широко используемый инструмент для прогнозирования сайтов сплайсинга и аберрантного сплайсинга. SpliceAI можно обучить на новых данных, например, полученных в ходе этого исследования, чтобы усовершенствовать свои возможности прогнозирования.
«SpliceAI часто не предоставляет подробную информацию о характеристиках экзонов и имеет плохую способность прогнозировать сплайсинг экзонов, которые еще не внесены в каталог», — сказал Хьюз.
«Наши данные о захвате экзонов содержат биологически значимую информацию, которую можно передать в SpliceAI и другие предсказатели сплайсинга, чтобы открыть новые пути для исследования темного генома».