Новое исследование показывает, что можно использовать машинное обучение и статистику для решения проблемы, которая долгое время препятствовала развитию метаболомики: большие различия в данных, собранных на разных сайтах.
«Мы не всегда знаем источник изменений», — сказал Дэниел Рафтери, профессор анестезиологии и медицины боли в Медицинской школе Вашингтонского университета в Сиэтле. «Это может быть связано с тем, что субъекты разные, с разной генетикой, диетой и воздействием окружающей среды. Или это может быть связано с тем, как образцы были собраны и обработаны».
Рафтери и его коллеги-исследователи хотели посмотреть, сможет ли машинное обучение — форма искусственного интеллекта, которая использует компьютерные алгоритмы для обработки больших объемов исторических данных и выявления закономерностей данных — уменьшить эти различия между данными из разных сайтов, не скрывая при этом важных различий.
«Мы хотели объединить эти несовпадающие наборы данных, чтобы результаты различных исследований можно было сравнить или объединить для дальнейшего анализа», — сказал Рафтери.
Он возглавлял проект вместе с Дабао Чжаном и Минь Чжаном, ранее работавшими в Университете Пердью, а теперь профессорами эпидемиологии и биостатистики Калифорнийского университета в сфере общественного здравоохранения Ирвина. Дэнни Лю, доктор философии. студент Пердью, был ведущим автором статьи, которая опубликована в журнале Proceedings of the National Academy of Sciences.
Исследователь метаболомики Дэниел Рафтери у подножия лестницы, ведущей к магнитно-резонансному спектрометру, в своей лаборатории в Медицинском центре митохондрий и метаболизма Университета штата Вашингтон в Сиэтле. Прибор помогает ученым идентифицировать и измерять молекулы в образцах крови. Фото: Брайан Донохью/UW Medicine.
Рафтери — исследователь в Центре митохондрий и метаболизма Университета штата Вашингтон, расположенном в Медицинском университете Саут-Лейк-Юнион Университета штата Вашингтон в Сиэтле.
Термин «метаболомика» относится к метаболизму — слову, описывающему химические реакции, которые наши клетки выполняют для поддержания жизни. К ним относятся реакции, которые расщепляют пищу для сбора энергии и получения сырья, необходимого клеткам для роста и восстановления, реакции, которые включают сборку клеточных компонентов, необходимых для жизни, и реакции, связанные с разборкой поврежденных или ненужных компонентов, чтобы их можно было переработать. , выброшены или использованы в качестве топлива.
Небольшие химические вещества, образующиеся в результате этих метаболических процессов , называются метаболитами. Уровни метаболитов показывают, какие химические реакции происходят внутри клетки, ткани, органа или организма в данный момент и как эти реакции могут меняться с течением времени.
Метаболомика – это изучение метаболитов и процессов, которые их производят.
Эта информация помогает ученым-медикам лучше понять не только то, как клетки поддерживают нормальную функцию, но и что может пойти не так, когда люди заболевают. По словам Рафтери, эти знания могут привести к новым способам диагностики, профилактики и лечения заболеваний.
В новом исследовании ученые построили модели машинного обучения, чтобы выявить факторы, вызывающие различия между наборами данных. Модели учитывали демографические различия в исследуемой популяции, такие как возраст и пол, и использовали информацию, содержащуюся в других метаболитах, для объяснения наблюдаемых различий.
Исследователи обнаружили, что их подход сократил различия между наборами данных более чем на 95%, не скрывая значимых различий, например тех, которые естественным образом возникают между мужчинами и женщинами.
«Мы показали, что наш подход потенциально может уменьшить нежелательные отклонения, наблюдаемые в метаболомных данных, сохраняя при этом интересующие метаболомические сигналы», — сказал Рафтери.
Группа планирует расширить свои исследования с целью обеспечить более глубокое понимание нормального метаболизма и выявить биомаркеры аномального метаболизма, которые могут быть признаком заболевания.