Быстрый прогресс в области искусственного интеллекта (ИИ) открыл путь для создания огромного спектра новых инструментов здравоохранения, но чтобы гарантировать, что эти инструменты не усугубят ранее существовавшее неравенство в отношении здоровья, исследователи призывают использовать более репрезентативные данные в своих разработках.
Исследователи из Наффилдского отделения ортопедии, ревматологии и опорно-двигательного аппарата (NDORMS) Оксфордского университета, Университетского колледжа Лондона и Центра исследований этнического здоровья при поддержке Health Data Research UK впервые изучили все детали данных об этнической принадлежности в Национальной системе здравоохранения (NHS). . Они подчеркивают важность использования репрезентативных данных в сфере здравоохранения и собрали эту информацию в базу данных, готовую к исследованию.
Новое исследование, опубликованное в журнале Scientific Data , является первой частью трехэтапного проекта, целью которого является уменьшение предвзятости в моделях прогнозирования здоровья ИИ, которые обучаются на реальных данных пациентов. Проект, направленный на устранение этнических различий, которые были выявлены во время пандемии, является частью национального базового исследования данных и связи COVID-19 правительства Великобритании, проводимого Health Data Research UK.
Исследователи использовали обезличенные данные об этнической принадлежности и других характеристиках из медицинских записей общей практики и больниц, к которым можно безопасно получить доступ в рамках службы Secure Data Environment (SDE) NHS England, через CVD-COVID-UK/COVID-IMPACT Центра науки о данных Британского кардиологического фонда. Консорциум.
Это первый случай, когда данные об этнической принадлежности пациентов изучаются так глубоко и широко для всего населения Англии. Исследователи смогли объединить записи для анализа этнической принадлежности пациента, записанной с помощью более чем 489 потенциальных кодов.
Исследователи проанализировали, как более 61 миллиона человек в Англии определили свою этническую принадлежность в более чем 250 различных группах. Они также рассмотрели характеристики тех, у кого нет записей об их этнической принадлежности, и то, как могут возникнуть конфликты в данных об этнической принадлежности пациентов. Данные, которые теперь доступны другим исследователям, показывают, что у 1/10 пациентов нет записей об этнической принадлежности, и около 12% пациентов имели противоречивые коды этнической принадлежности в своих картах пациентов.
Сара Халид, доцент кафедры медицинской информатики и биомедицинских данных в NDORMS, объяснила: «Неравенство в отношении здоровья было подчеркнуто во время пандемии COVID19, когда люди из этнических групп пострадали непропорционально, но эта проблема является давней и многогранной.
«Поскольку технология здравоохранения на основе искусственного интеллекта зависит от данных, которые в нее подаются, отсутствие репрезентативных данных может привести к предвзятым моделям, которые в конечном итоге дают неправильные оценки состояния здоровья. Более качественные данные из реальных условий, такие как данные, которые мы собрали , может привести к улучшению технологий и, в конечном итоге, к улучшению здоровья для всех».
Профессор Кэти Садлоу, главный научный сотрудник компании Health Data Research UK и директор ее Центра обработки данных BHF, сказала: «Мы рады оказать поддержку сотням исследователей в использовании возможностей богатых данных о здоровье Великобритании. Это исследование по регистрации этнической принадлежности подчеркивает, насколько различны к источникам данных о состоянии здоровья всего населения Англии можно получить доступ и проанализировать их безопасным и надежным способом, предоставляя информацию, которая актуальна для всех.
«Результаты дадут возможность медицинским работникам, пациентам, лицам, осуществляющим уход, и политикам принимать более правильные решения, которые принесут пользу людям всех возрастов, этнических групп и социального происхождения по всей стране».
В исследовании оценивались доступные подробные данные об этнической принадлежности в Национальной системе здравоохранения Англии, в том числе по различным типам кодов этнической принадлежности. Например, больницы Национальной службы здравоохранения записывают данные пациентов с помощью 19 кодов этнической принадлежности, в то время как врачи общей практики используют всемирно признанные коды SNOMED-CT, которых насчитывается 489. Однако исследователи в области здравоохранения теряют более мелкие детали из этих систем регистрации, поскольку они обычно сводят эти группы в простые пять или шесть, что потенциально может привести к менее точным исследованиям.
Исследователи планируют продемонстрировать ценность этих выводов на последующих этапах проекта, который сначала сосредоточится на использовании этих подробных результатов по данным об этнической принадлежности , чтобы лучше описать, как пандемия COVID-19 повлияла на различные этнические группы, а затем включит их в более подробную информацию. равноправные инструменты искусственного интеллекта и машинного обучения, подходящие для использования различными группами пациентов.