Передовые системы искусственного интеллекта (ИИ) показали себя многообещающими в революционном изменении области патологии, изменив обнаружение, диагностику и лечение заболеваний; однако недостаточная представленность определенных групп пациентов в наборах патологоанатомических данных, используемых для разработки моделей ИИ, может ограничить общее качество их работы и увеличить различия в состоянии здоровья.
Новое исследование, проведенное исследователями из Mass General Brigham, подчеркивает, что стандартные системы вычислительной патологии работают по-разному в зависимости от демографических профилей, связанных с гистологическими изображениями, но более крупные «фундаментальные модели» могут помочь частично смягчить эти различия.
Результаты, опубликованные 19 апреля в журнале Nature Medicine, подчеркивают необходимость в более разнообразных наборах обучающих данных и демографических стратифицированных оценках систем искусственного интеллекта, чтобы обеспечить справедливую выгоду от их использования всем группам пациентов .
«Не было проведено всестороннего анализа эффективности алгоритмов ИИ в патологии, стратифицированного среди различных демографических групп пациентов на основе независимых тестовых данных», — сказал соответствующий автор Фейсал Махмуд, доктор философии, из отдела вычислительной патологии в отделении патологии в Массовый генерал Бригам.
«Это исследование, основанное как на общедоступных наборах данных, которые широко используются для исследований ИИ в патологии, так и на внутренних когортах Mass General Brigham, выявляет заметные различия в производительности для пациентов разных рас, типов страхования и возрастных групп. Мы показали, что передовые модели глубокого обучения Обучение с самоконтролем, известное как «фундаментальные модели», может уменьшить эти различия в производительности и повысить точность».
Основываясь на данных широко используемых Атласа генома рака и атласа опухолей головного мозга EBRAINS, которые преимущественно включают данные белых пациентов, исследователи разработали модели вычислительной патологии для определения подтипов рака молочной железы, подтипирования рака легких и прогнозирования мутации глиомы IDH1 (важный фактор в терапевтическом лечении). ответ).
Когда исследователи проверили точность этих моделей, используя гистологические слайды более чем 4300 пациентов с раком в Mass General Brigham и Атласе генома рака, а также стратифицировали результаты по расе, они обнаружили, что модели работали более точно у белых пациентов, чем у чернокожих пациентов. Модели, которые команда протестировала для определения подтипов рака молочной железы и легких и прогнозирования мутации IDH1 при глиоме, обнаружили соответствующие различия в 3,7, 10,9 и 16% при создании правильных классификаций.
Исследователи стремились уменьшить наблюдаемые различия с помощью стандартных методов машинного обучения для смягчения предвзятости, таких как выделение примеров из недостаточно представленных групп во время обучения модели; однако эти методы лишь незначительно уменьшили погрешность.
Вместо этого различия были уменьшены за счет использования базовых моделей с самоконтролем , которые представляют собой новую форму продвинутого искусственного интеллекта, обученного на больших наборах данных для выполнения широкого спектра клинических задач. Эти модели кодируют более богатые представления гистологических изображений, что может снизить вероятность систематической ошибки модели.
Несмотря на наблюдаемые улучшения, пробелы в производительности все еще были очевидны, что отражает необходимость дальнейшего совершенствования базовых моделей патологии. Кроме того, исследование было ограничено небольшим количеством пациентов из некоторых демографических групп.
Исследователи продолжают исследовать, как мультимодальные базовые модели, включающие в себя различные формы данных, такие как геномика или электронные медицинские записи, могут улучшить эти модели.
Появление инструментов искусственного интеллекта в медицине может положительно изменить процесс оказания медицинской помощи. Крайне важно сбалансировать инновационный потенциал искусственного интеллекта с приверженностью качеству и безопасности. Генерал штата Массачусетс Бригам является лидером в области ответственного ИИ, проводя тщательные исследования новых и перспективных технологий для внедрения ИИ в медицину.
«В целом, результаты этого исследования представляют собой призыв к действию для разработки более справедливых моделей ИИ в медицине», — сказал Махмуд. «Это призыв к действию для ученых использовать более разнообразные наборы данных в исследованиях, а также призыв к регулирующим и политическим органам включать демографические стратифицированные оценки этих моделей в свои рекомендации по оценке, прежде чем утверждать и развертывать их, чтобы гарантировать, что системы ИИ приносить пользу всем группам пациентов на справедливой основе».