Новый компьютерный алгоритм SCENIC реконструирует генную регуляторную сеть и распознает состояние одиночной клетки. Использование разработанной бельгийскими учеными программы позволило различить отдельные типы раковых клеток в олигодендроглиоме и меланоме. Статья опубликована в журнале Nature Methods.

Процесс синтеза РНК в клетке зависит от сети регуляции генов , в которой ограниченное количество факторов транскрипции и кофакторов регулируют друг друга и синтезируемые гены. Синтезируемые белки определяют работу различных клеток организма, что позволяет распознавать и отличать их. Всего было разработано несколько методов, позволяющих определить из данных секвенирования РНК отдельной клетки, какие белки ей производятся, но эти методы не использовали анализ регуляторной последовательности для прогнозирования взаимодействия между факторами транскрипции и целевыми генами. В новом алгоритме эти связи учитываются.

Строго говоря, SCENIC (расшифровывается как Single-CEll regulatory Network Inference and Clustering, распознавание и кластеризация регуляторной сети отдельной клетки) — это не отдельная программа, а рабочий процесс, основанный на использовании трех новых пакетов проекта Bioconductor. Первый из них, GENIE3, определяет потенциальные целевые факторы транскрипции на основе коэкспрессии. Второй, RcisTarget, ищет наиболее важные факторы и определяет прямые цели анализа (регулоны). Наконец, третий, AUCell, оценивает активность регулонов в отдельных клетках. Также ученые использовали инструмент GRNBoost в качестве альтернативы GENIE3 на больших наборах данных. Подробную документацию всех перечисленных программ, а также исходный код и обучающие руководства можно найти на сайте проекта.

Чтобы оценить работу алгоритма, ученые протестировали его на данных секвенирования РНК хорошо изученных клеток мышиного мозга. Программа выявила из 1046 исходных модулей коэкспрессии 151 регулонов. Оценивая активность регулонов, ученые выявили ожидаемые типы клеток вместе со списком потенциальных основных регуляторов для каждого типа. Более того, кластерный анализ по типу клетки оказался точнее, чем у многих специализированных методов кластеризации отдельных клеток.

Различные типы раковых клеток, найденных в тканях. Сверху приведены данные для олигодендроглиомы, снизу — для меланомы.
Различные типы раковых клеток, найденных в тканях. Сверху приведены данные для олигодендроглиомы, снизу — для меланомы.

Также исследователи применили SCENIC для определения состояний клеток в наборе данных, полученных РНК-секвенированием 4043 клеток олигодендроглиомы (взятых из шести различных опухолей) и 1252 клеток меланомы (взятых из 14 поражений). Из-за мутаций клеток, специфичных для опухолей, и сложных хромосомных аберраций распознавание состояний раковых клеток оказалось более сложным, чем для случая нормальных клеточных состояний. Обычный кластерный анализ позволяет установить только тип ткани, из которой была взята раковая клетка, но SCENIC разглядел более сложную картину. Для олигодендроглиомы он обнаружил три различных типа клеток, для меланомы — два.

С помощью разработанного учеными алгоритма можно будет построить более точную карту клеток человеческого тела. Также он поможет лучше понять процессы, управляющие производством и активностью различных типов клеток, и позволит эффективнее распознавать различные виды рака.