Недостаточно доказательств того, что скрининг на рак груди на ИИ является достаточно точным, чтобы заменить человеческое наблюдение

Статьи 04.09.2020

Автор: admin

Люди по-прежнему кажутся лучше, чем технологии, когда дело доходит до точности выявления возможных случаев рака груди во время скрининга, говорится в обзоре, опубликованном сегодня в BMJ .

Исследователи говорят, что в настоящее время отсутствуют качественные доказательства в поддержку политики замены людей-радиологов технологиями искусственного интеллекта (ИИ) при скрининге на рак груди .

Breast рак является ведущей причиной смерти среди женщин во всем мире , и многие страны ввели маммографии программы для обнаружения и лечения его рано. Но изучение маммограмм на предмет ранних признаков рака — это повторяющаяся работа большого объема для радиологов, и некоторые виды рака не учитываются.

Предыдущие исследования показали, что системы искусственного интеллекта превосходят людей и вскоре могут быть использованы вместо опытных радиологов. Тем не менее, недавний обзор 23 исследований выявил пробелы в доказательствах и опасения по поводу используемых методов.

Чтобы устранить эту неопределенность, Национальный скрининговый комитет Великобритании поручил группе исследователей из Уорикского университета изучить точность ИИ для обнаружения рака груди в практике маммографического скрининга.

Исследователи проанализировали 12 исследований, проведенных с 2010 года, с участием 131 822 женщин в Швеции, США, Германии, Нидерландах и Испании.

В целом качество методов, использованных в 12 исследованиях, было низким, а их применимость к европейским или британским программам скрининга рака груди была низкой.

В трех крупных исследованиях с участием 79 910 женщин сравнивались системы искусственного интеллекта с клиническими решениями первоначального радиолога . Из них 1878 человек прошли скрининг на рак или интервальный рак (рак был диагностирован между назначениями на скрининг) в течение 12 месяцев после скрининга.

Большинство (34 из 36 или 94%) систем искусственного интеллекта, оцененных в этих трех исследованиях, были менее точными, чем один радиолог, и все они были менее точными, чем консенсус двух или более радиологов, что является стандартной практикой в Европе.

Напротив, пять небольших исследований с участием 1086 женщин показали, что все оцениваемые системы искусственного интеллекта были более точными, чем у одного радиолога. Но исследователи отмечают, что эти исследования подвергались высокому риску предвзятости, и их многообещающие результаты не воспроизводятся в более крупных исследованиях.

В трех исследованиях ИИ использовался в качестве предварительного скрининга для определения того, какие маммограммы должны быть исследованы радиологом, а какие не проверяли 53%, 45% и 50% женщин с низким риском, но также 10%, 4%, и 0% раковых заболеваний, обнаруженных радиологами.

Авторы указывают на некоторые ограничения исследования, такие как исключение неанглийских исследований, которые могли содержать соответствующие доказательства, и они признают, что алгоритмы ИИ недолговечны и постоянно улучшаются, поэтому опубликованные оценки систем ИИ могут быть устаревшими к моменту исследования. публикация.

Тем не менее, использование строгих критериев включения в исследование вместе со строгой и систематической оценкой качества исследования предполагает, что их выводы являются надежными.

Таким образом, они говорят: «Текущие данные об использовании систем искусственного интеллекта при скрининге рака груди далеки от качества и количества, необходимых для их внедрения в клиническую практику».

Они добавляют: «Необходимы хорошо спланированные сравнительные исследования точности тестов, рандомизированные контролируемые исследования и когортные исследования в больших скрининговых группах, которые оценивают коммерчески доступные системы искусственного интеллекта в сочетании с радиологами в клинической практике».