Medical card
A bad doctor treats the disease, a good doctor treats the cause of the disease.
  • гепатит
  • Недели беременности

    Беременность по неделям

  • Сколько живут с диагнозом рак
  • Как рыбий жир может уменьшить воспаление

Трансферное обучение открывает путь к новым методам лечения заболеваний

2024-03-14 13:48:31

Технологические достижения в области секвенирования генов и вычислений привели к взрывному росту доступности биоинформатических данных и вычислительной мощности, соответственно, создав зрелую основу для искусственного интеллекта (ИИ) для разработки стратегий управления поведением клеток.



В новом исследовании исследователи Северо-Западного университета извлекли плоды из этой взаимосвязи, разработав подход к трансферному обучению на основе искусственного интеллекта, который переназначает общедоступные данные для прогнозирования комбинаций генных возмущений, которые могут трансформировать тип клеток или восстановить здоровье больных клеток.


Исследование «Дизайн клеточного перепрограммирования посредством трансферного обучения функциональных транскрипционных сетей» опубликовано на этой неделе в журнале Proceedings of the National Academy of Sciences .


С момента завершения проекта генома человека 20 лет назад ученые знали, что ДНК человека включает более 20 000 генов. Однако остается загадкой, как эти гены работают вместе, управляя сотнями различных типов клеток в нашем организме.


Удивительно, но, по сути, методом проб и ошибок исследователи продемонстрировали, что можно «перепрограммировать» тип клеток, манипулируя лишь несколькими генами. Проект генома человека также способствовал развитию технологий секвенирования, удешевив не только чтение генетического кода, но и измерение экспрессии генов, что позволяет количественно определить предшественников белков, выполняющих клеточные функции.


Это увеличение доступности привело к накоплению огромного количества общедоступных биоинформатических данных, что открыло возможность синтеза этих данных для рационального проектирования генных манипуляций, которые могут вызвать желаемое поведение клеток.



Способность контролировать поведение клеток и, следовательно, переходы между типами клеток может быть применена для восстановления поврежденных тканей или для преобразования раковых клеток обратно в нормальные клетки.


Повреждения тканей, возникшие в результате инсультов, артрита и рассеянного склероза, ежегодно поражают 2,9 миллиона человек в Соединенных Штатах, что обходится им в 400 миллионов долларов в год . Между тем, рак является причиной около 10 миллионов смертей ежегодно во всем мире, а экономические издержки исчисляются триллионами долларов.


Поскольку нынешний стандарт лечения не регенерирует ткани и/или имеет ограниченную эффективность, существует острая необходимость в разработке более эффективных методов лечения, которые широко применимы, что, в свою очередь, требует идентификации молекулярных вмешательств, которые можно вывести из данных с высокой пропускной способностью.


В новом исследовании исследователи тренируют свой ИИ, чтобы узнать, как экспрессия генов приводит к поведению клеток, используя общедоступные данные об экспрессии генов. Прогнозирующая модель , созданная в результате этого процесса обучения, передается в конкретные приложения по перепрограммированию клеток. В каждом приложении этот подход находит комбинацию генных манипуляций, которая с наибольшей вероятностью вызовет желаемый переход типа клеток.


Беспрецедентное исследование общегеномной динамики

«Наша работа отличается от предыдущих подходов к рациональному разработке стратегий манипулирования поведением клеток», — сказал Томас Вайток, ведущий автор статьи и член Центра сетевой динамики Северо-Западного университета. «Эти подходы в основном делятся на две категории: первый, в котором гены организованы в сети в соответствии с их взаимодействием или общими свойствами; и другой, в котором экспрессия генов в здоровых и больных клетках сравнивается, чтобы выделить гены, которые демонстрируют наибольшие различия. ."


В первой категории существует компромисс между реализмом и масштабом. Некоторые сетевые модели включают множество генов, но говорят только о наличии или отсутствии связи. Другие модели являются количественными и экспериментально подтвержденными, но обязательно включают небольшое количество генов и связей.


Новая работа Northwestern сохраняет сильные стороны обоих типов моделей: она включает все гены в клетке и количественно отражает их экспрессию. Это достигается за счет сокращения экспрессии почти 20 000 отдельных генов до не более чем 10 линейных комбинаций таких генов, которые представляют собой средневзвешенные значения, называемые собственными генами.


«Эйгенгены, по сути, показывают, как гены действуют согласованно, что позволяет упростить динамику большой динамической сети до нескольких движущихся частей», — сказал Адилсон Моттер, профессор физики Чарльза Э. и Эммы Х. Моррисон в Вайнбергском колледже. Кандидат искусств и наук, директор Центра сетевой динамики Северо-Западного университета и старший автор исследования. «Каждый собственный ген можно рассматривать как обобщенный путь, который приблизительно независим от других. Таким образом, собственные гены приобретают соответствующие корреляции и независимость в регуляторной сети генов».


Подходы второй категории позволяют найти отдельные гены, связанные с изменением поведения клеток, но не позволяют определить, как гены работают вместе, обеспечивая это изменение. Новый подход решает эту проблему, признавая, что гены меняют свое выражение согласованно. Количественный учет этого свойства с точки зрения собственных генов позволяет аддитивно комбинировать их реакции на различные генные возмущения путем их соответствующего масштабирования. Затем объединенные ответы можно ввести в модель искусственного интеллекта, чтобы определить, какие возмущения вызывают желаемое поведение клеток.



Предотвращение комбинаторного взрыва

Используя эту модель искусственного интеллекта, исследователи собрали общедоступные данные, чтобы определить, как меняется экспрессия генов, когда одиночный ген нарушается из-за экзогенного повышения или понижения его экспрессии. Затем они разработали алгоритм для решения обратной задачи, которая заключается в прогнозировании комбинаций генов, которые с наибольшей вероятностью вызовут желаемый переход к перепрограммированию, например, заставят больные клетки вести себя как здоровые клетки.


Подход, возникающий в результате интеграции данных и алгоритма, позволяет избежать комбинаторного взрыва, который может возникнуть в результате тестирования всех комбинаций с целью выявления эффективных. Это важно, поскольку эксперименты позволяют проверить только ограниченное количество случаев, а алгоритм позволяет выявить наиболее многообещающие случаи для проверки.


«Этот подход поражает своей способностью исследовать множество комбинаций с помощью вычислений», — сказал Вайток. «Например, парные комбинации 200 возмущений дают 20 000 случаев, тройки дают более 1,3 миллиона случаев, и это число продолжает расти экспоненциально. Поскольку алгоритм использует оптимизацию, этот подход позволяет сравнивать прогнозы по потенциально бесконечному числу комбинаций с помощью магии исчисление."


Еще одна проблема, которую решает этот подход, заключается в том, что пертурбации генов могут сочетаться неаддитивным образом. Например, рассмотрим влияние изменений генов на скорость роста клеток и представьте, что эти изменения сокращают скорость роста вдвое, если применять их изолированно.


Эффект двух таких возмущений суммируется неаддитивно, если они уменьшают рост либо значительно больше, либо значительно меньше половины половины (или одной четверти). Несмотря на то, что существует большое количество исследований, характеризующих неаддитивные взаимодействия между генами, новый подход эффективен даже без учета таких отклонений от аддитивности.


«Это тот случай, когда целое хорошо аппроксимируется суммой частей», — сказал Моттер.


«Это свойство вмешательств, необходимых для индукции переходов между типами клеток, противоречит здравому смыслу, поскольку сами типы клеток возникают в результате коллективных взаимодействий между генами».


Поскольку этот подход решает основные проблемы контроля поведения клеток, его можно применять ко многим различным биомедицинским состояниям, в том числе к тем, которые будут полезны благодаря будущим данным.


Гибкая модель предстоящих данных

Тот факт, что реакции на генные пертурбации аддитивно сочетаются, облегчает обобщение по типам клеток. Например, если ген разрушается в клетке кожи, результирующее влияние на экспрессию будет в значительной степени таким же, как и в клетке печени.


Таким образом, подход на основе искусственного интеллекта можно рассматривать как платформу, в которую можно вставлять данные, относящиеся к конкретному заболеванию у конкретного пациента. Этот подход можно применять всякий раз, когда лечение заболевания можно рассматривать как проблему перепрограммирования, как в случае рака, диабета и аутоиммунных заболеваний, которые возникают в результате клеточной дисфункции.


Универсальность подхода позволяет быстро контекстуализировать экспрессию генов в одном исследовании по всем доступным данным в архиве чтения секвенирования Национального центра биотехнологической информации, который является крупнейшим общедоступным хранилищем данных об экспрессии генов .


Этот архив увеличился в 100 раз с 10 терабайт до 1000 терабайт в период с 2012 по 2022 год и продолжает расти в геометрической прогрессии по мере снижения затрат на секвенирование. Эта работа представляет собой важнейший инструмент для перевода этого огромного количества данных в конкретные прогнозы того, как гены работают вместе, контролируя поведение нормальных и больных клеток.


Оставьте комментарии и отзывы!

Используйте нормальные имена. Ваш комментарий будет опубликован после проверки.

(обязательно)