Ученые из Стэнфорда разработали нейронную сеть, которая определяет пневмонию по фронтальным рентгеновским снимкам грудной клетки не хуже, чем практикующие врачи. Препринт статьи выложен на сайте arXiv.org.

Только в США каждый год с диагнозом «пневмония» госпитализируют более одного миллиона человек, причем около 50 тысяч из них умирает от этой болезни. В России эти показатели составляют около 500 и 20 тысяч соответственно. Поэтому диагностика пневмонии (особенно на ранних стадиях) очень важна. В настоящее время самым распространенным и надежным способом является диагностика с помощью рентгеновских снимков грудной клетки.

К несчастью, распознать пневмонию на рентгеновских снимках довольно сложно, поскольку поражения легких часто имеют смутные очертания и к тому же иногда очень похожи на другие заболевания. Поэтому рентгенолог должен иметь высокую квалификацию, чтобы диагностировать пневмонию. В данной работе ученые сообщают об алгоритме, который распознает пневмонию на рентгеновских снимках не хуже, а в некоторых случаях даже лучше, чем практикующие специалисты.

Чтобы разработать этот алгоритм, ученые построили 121-уровневую нейронную сеть (аналогичную сети из более старой работы) и обучили ее на выборке ChestX-ray 14, состоящей из 112120 фронтальных фотографий грудной клетки, полученных от 30805 пациентов. Каждый снимок сопровождался информацией о 14 заболеваниях легких, в частности, о пневмонии. Перед обучением ученые сжали фотографии до размера 224×224 пикселя и нормализовали базу данных. После этого они случайным образом выбрали из базы 80 процентов фотографий, на которых провели обучение нейросети, а оставшиеся 20 процентов исследователи оставили для проверки ее работы.

Затем ученые отобрали из базы 420 картинок и сравнили работу алгоритма с результатами диагностики четырех врачей из Стэнфордского Университета, практикующих в течение четырех, семи, двадцати пяти и двадцати восьми лет. Рентгенологи не имели доступа к истории болезни пациентов и могли использовать для диагностики только выданные им фотографии. Оказалось, что нейросеть распознает патологию не хуже, чем настоящие врачи (а в некоторых случаях даже лучше). Так, площадь под кривой ошибок составляет для нее примерно 0,788. Вообще говоря, программа распознавала также оставшиеся 13 заболеваний, но эти показатели исследователи с диагнозами врачей не сравнивали.

Кривая ошибок для разработанного алгоритма (синяя линия). Крестиками отмечены результаты диагностики практикующих специалистов.
Кривая ошибок для разработанного алгоритма (синяя линия). Крестиками отмечены результаты диагностики практикующих специалистов.
Примеры патологий, распознанных нейросетью
Примеры патологий, распознанных нейросетью

В то же время, ученые отмечают, что обычно рентгенологи используют для диагностики не только фронтальные рентгеновские снимки, но также боковые снимки и историю болезни. Поэтому пока что диагноз, поставленный человеком, будет все-таки точнее, чем предсказание нейросети. Тем не менее, разработанная программа поможет диагностировать пневмонию в тех местах, где высококвалифицированных специалистов не хватает.