Недостаточно доказательств того, что скрининг на рак груди на ИИ является достаточно точным, чтобы заменить человеческое наблюдение

Недостаточно доказательств того, что скрининг на рак груди на ИИ является достаточно точным, чтобы заменить человеческое наблюдение

Люди по-прежнему кажутся лучше, чем технологии, когда дело доходит до точности выявления возможных случаев рака груди во время скрининга, говорится в обзоре, опубликованном сегодня в BMJ .

Исследователи говорят, что в настоящее время отсутствуют качественные доказательства в поддержку политики замены людей-радиологов технологиями искусственного интеллекта (ИИ) при скрининге на рак груди .

Breast рак является ведущей причиной смерти среди женщин во всем мире , и многие страны ввели маммографии программы для обнаружения и лечения его рано. Но изучение маммограмм на предмет ранних признаков рака — это повторяющаяся работа большого объема для радиологов, и некоторые виды рака не учитываются.

Предыдущие исследования показали, что системы искусственного интеллекта превосходят людей и вскоре могут быть использованы вместо опытных радиологов. Тем не менее, недавний обзор 23 исследований выявил пробелы в доказательствах и опасения по поводу используемых методов.

Чтобы устранить эту неопределенность, Национальный скрининговый комитет Великобритании поручил группе исследователей из Уорикского университета изучить точность ИИ для обнаружения рака груди в практике маммографического скрининга.

Исследователи проанализировали 12 исследований, проведенных с 2010 года, с участием 131 822 женщин в Швеции, США, Германии, Нидерландах и Испании.

В целом качество методов, использованных в 12 исследованиях, было низким, а их применимость к европейским или британским программам скрининга рака груди была низкой.

В трех крупных исследованиях с участием 79 910 женщин сравнивались системы искусственного интеллекта с клиническими решениями первоначального радиолога . Из них 1878 человек прошли скрининг на рак или интервальный рак (рак был диагностирован между назначениями на скрининг) в течение 12 месяцев после скрининга.

Большинство (34 из 36 или 94%) систем искусственного интеллекта, оцененных в этих трех исследованиях, были менее точными, чем один радиолог, и все они были менее точными, чем консенсус двух или более радиологов, что является стандартной практикой в Европе.

Напротив, пять небольших исследований с участием 1086 женщин показали, что все оцениваемые системы искусственного интеллекта были более точными, чем у одного радиолога. Но исследователи отмечают, что эти исследования подвергались высокому риску предвзятости, и их многообещающие результаты не воспроизводятся в более крупных исследованиях.

В трех исследованиях ИИ использовался в качестве предварительного скрининга для определения того, какие маммограммы должны быть исследованы радиологом, а какие не проверяли 53%, 45% и 50% женщин с низким риском, но также 10%, 4%, и 0% раковых заболеваний, обнаруженных радиологами.

Авторы указывают на некоторые ограничения исследования, такие как исключение неанглийских исследований, которые могли содержать соответствующие доказательства, и они признают, что алгоритмы ИИ недолговечны и постоянно улучшаются, поэтому опубликованные оценки систем ИИ могут быть устаревшими к моменту исследования. публикация.

Тем не менее, использование строгих критериев включения в исследование вместе со строгой и систематической оценкой качества исследования предполагает, что их выводы являются надежными.

Таким образом, они говорят: «Текущие данные об использовании систем искусственного интеллекта при скрининге рака груди далеки от качества и количества, необходимых для их внедрения в клиническую практику».

Они добавляют: «Необходимы хорошо спланированные сравнительные исследования точности тестов, рандомизированные контролируемые исследования и когортные исследования в больших скрининговых группах, которые оценивают коммерчески доступные системы искусственного интеллекта в сочетании с радиологами в клинической практике».

Комментариев нет, будьте первым кто его оставит