Беседы о здоровье
Онкология
Общероссийская газета для пациентов
Все статьи

Инструменты машинного обучения, подобные этому, могли бы дать онкологам возможность выбирать более эффективные методы лечения и давать больше рекомендаций своим пациентам. Источник: Массачусетский технологический институт

Использование машинного обучения для выявления недиагностируемых видов рака

20.10.2022

Первым шагом в выборе подходящего лечения для онкологического больного является определение его конкретного типа рака, включая определение первичного очага – органа или части тела, где начинается рак.

В редких случаях происхождение рака не может быть определено даже при тщательном тестировании. Хотя эти виды рака неизвестной первичности, как правило, агрессивны, онкологи должны лечить их с помощью нецелевой терапии, которая часто обладает сильной токсичностью и приводит к низким показателям выживаемости.

Новый подход с глубоким обучением, разработанный исследователями из Института интегративных исследований рака имени Коха при Массачусетском технологическом институте и Массачусетской больнице общего профиля (MGH), может помочь классифицировать первичные виды рака.

Инструменты машинного обучения могут расширить возможности онкологов выбирать более эффективные методы лечения и давать больше рекомендаций своим пациентам. Однако создание модели машинного обучения, которая использует различия между здоровыми и нормальными клетками, а также между различными видами рака, в качестве диагностического инструмента – это балансирующий акт. Если модель слишком сложна и учитывает слишком много особенностей экспрессии* генов рака, может показаться, что модель отлично усваивает обучающие данные, но дает сбои, когда сталкивается с новыми данными. Однако, упрощая модель за счет сужения числа признаков, модель может упустить те виды информации, которые привели бы к точной классификации типов рака.

Чтобы найти баланс между сокращением количества признаков и извлечением наиболее релевантной информации, команда ученых сосредоточила модель на признаках измененных путей развития в раковых клетках. По мере развития эмбриона и специализации недифференцированных клеток в различные органы множество путей определяет, как клетки делятся, растут, меняют форму и мигрируют. По мере развития опухоли раковые клетки теряют многие специализированные черты зрелой клетки. В то же время они начинают в чем-то напоминать эмбриональные клетки, поскольку приобретают способность к пролиферации, трансформации и метастазированию в новые ткани.

Исследователи сравнили два больших клеточных атласа, выявив корреляции между опухолевыми и эмбриональными клетками: Атлас генома рака (TCGA), который содержит данные об экспрессии генов для 33 типов опухолей, и Атлас клеток органогенеза мыши (MOCA), который описывает 56 отдельных траекторий эмбриональных клеток по мере их развития и дифференцировки.

Полученная карта корреляций между паттернами экспрессии генов развития в опухолевых и эмбриональных клетках была преобразована в модель машинного обучения. Исследователи разбили экспрессию генов образцов опухолей из TCGA на отдельные компоненты, которые соответствуют определенному моменту времени в траектории развития, и присвоили каждому из этих компонентов математическое значение. Затем исследователи построили модель машинного обучения, называемую Многослойным персептроном развития (D-MLP), которая оценивает опухоль по ее компонентам развития, а затем предсказывает ее происхождение.

После обучения D-MLP был применен к 52 новым образцам особо сложных видов рака неизвестного первичного происхождения, которые не могли быть диагностированы с помощью доступных инструментов. Эти случаи были самыми сложными, наблюдавшимися за четырехлетний период. Интересно, что модель классифицировала опухоли по четырем категориям и дала прогнозы и другую информацию, которая могла бы помочь в диагностике и лечении этих пациентов.

Например, один образец был взят у пациентки с раком молочной железы в анамнезе, у которой были обнаружены признаки агрессивного рака в жидкостных пространствах вокруг брюшной полости. Онкологи изначально не могли найти опухолевую массу и не могли классифицировать раковые клетки, используя инструменты, которые у них были в то время. Тем не менее, D-MLP сильно предсказал рак яичников. Через 6 месяцев после того, как пациентка впервые обратилась к врачу, в яичнике было обнаружено образование, которое оказалось источником опухоли.

Хотя исследование представляет собой мощный подход к классификации опухолей, оно имеет некоторые ограничения. В будущей работе исследователи планируют увеличить прогностическую способность своей модели за счет включения других типов данных, в частности информации, полученной из радиологии, микроскопии и других видов визуализации опухолей.

Источник: Enrico Moiso et al, Developmental Deconvolution for Classification of Cancer Origin, Cancer Discovery (2022).

*экспрессия гена – это процесс, посредством которого информация из гена преобразуется в функциональный продукт, то есть, то, как ген себя проявляет.


Общественный совет пациентских организаций

При поддержке