Новият алгоритъм за машинно обучение открива генен сигнатур, характерен за туморите

Как раковите клетки се различават от здравите клетки? Нов алгоритъм за машинно обучение, наречен “ikarus”, знае отговора, съобщава екип, ръководен от биоинформатика на MDC Алтуна Акалин в списанието Genome Biology. Програмата за изкуствен интелект е открила генен сигнатур, характерен за туморите.

Когато става въпрос за идентифициране на модели в планини от данни, човешките същества не могат да се равняват на изкуствения интелект (AI). По-специално, клон на AI, наречен машинно обучение, често се използва за намиране на закономерности в наборите от данни – било то за анализ на фондовия пазар, разпознаване на изображения и реч или класификация на клетки. За надеждно разграничаване на раковите клетки от здравите клетки, екип, ръководен от д-р. Алтуна Акалин, ръководител на платформата за наука за данни за биоинформатика и Omics в Центъра за молекулярна медицина Макс Делбрюк в Асоциацията на Хелмхолц (MDC), сега разработи програма за машинно обучение, наречена „Icarus“. Програмата откри модел в туморните клетки, който е общ за различните видове рак, състоящ се от характерна комбинация от гени. Според статията на екипа в списанието Genome Biology, алгоритъмът също така открива видове гени в модела, които никога преди не са били ясно свързани с рака.

Машинното обучение по същество означава, че алгоритъмът използва данни за обучение, за да научи как да отговаря сам на определени въпроси. Той прави това чрез търсене на модели в данните, които му помагат да решава проблеми. След фазата на обучение системата може да обобщи от това, което е научила, за да оцени неизвестни данни.

Беше голямо предизвикателство да се получат подходящи данни за обучение, където експертите вече бяха направили ясно разграничение между „здрави“ и „ракови“ клетки“.

Ян Домен, първият автор на статията

Изненадващо висок процент на успех

В допълнение, наборите от данни за секвениране на една клетка често са шумни. Това означава, че информацията, която съдържат за молекулярните характеристики на отделните клетки, не е много точна – може би защото във всяка клетка се открива различен брой гени или защото пробите не винаги се обработват по един и същи начин. Както Домен и неговият колега д-р. Ведран Франке, съ-ръководител на проучването, съобщава, че те пресяха безброй публикации и се свързаха с доста изследователски групи, за да получат адекватни набори от данни. Екипът в крайна сметка използва данни от ракови клетки на белия дроб и колоректалния рак, за да обучи алгоритъма, преди да го приложи към набори от данни за други видове тумори.

Във фазата на обучение Икар трябваше да намери списък с характерни гени, които след това използва за категоризиране на клетките. „Изпробвахме и усъвършенствахме различни подходи“, казва Домен. Това беше отнемаща време работа, както разказват и тримата учени. „Ключът беше ikarus да използва в крайна сметка два списъка: един за ракови гени и един за гени от други клетки“, обяснява Франке. След фазата на обучение, алгоритъмът успя да разграничи надеждно здрави и туморни клетки и при други видове рак, като например в тъканни проби от пациенти с рак на черния дроб или невробластом. Успеваемостта му беше изключително висока, което изненада дори изследователската група. „Не очаквахме да има общ подпис, който толкова точно дефинира туморните клетки на различни видове рак“, казва Акалин. „Но все още не можем да кажем дали методът работи за всички видове рак“, добавя Домен. За да превърнат ikarus в надежден инструмент за диагностика на рак, изследователите сега искат да го тестват върху допълнителни видове тумори.

AI като напълно автоматизиран диагностичен инструмент

Проектът има за цел да надхвърли класификацията на “здрави” срещу “ракови” клетки. В първоначалните тестове ikarus вече демонстрира, че методът може също да разграничи други типове (и определени подтипове) клетки от туморни клетки. „Искаме да направим подхода по-изчерпателен“, казва Акалин, „като го доразвием, така че да може да прави разлика между всички възможни типове клетки в биопсия“.

В болниците патолозите са склонни само да изследват тъканни проби от тумори под микроскоп, за да идентифицират различните типове клетки. Това е трудоемка, отнемаща време работа. С ikarus тази стъпка може един ден да се превърне в напълно автоматизиран процес. Освен това, отбелязва Акалин, данните могат да се използват за извличане на заключения относно непосредствената среда на тумора. И това може да помогне на лекарите да изберат най-добрата терапия. Тъй като съставът на раковата тъкан и микросредата често показва дали определено лечение или лекарство ще бъде ефективно или не. Освен това AI може да бъде полезен и при разработването на нови лекарства. “Ikarus ни позволява да идентифицираме гени, които са потенциални двигатели на рака”, казва Акалин. След това могат да се използват нови терапевтични агенти за насочване към тези молекулярни структури.

Сътрудничество между дома и офиса

Забележителен аспект на публикацията е, че тя е изготвена изцяло по време на пандемията на COVID. Всички замесени не бяха на обичайните си бюра в Берлинския институт за биология на медицинските системи (BIMSB), който е част от MDC. Вместо това те бяха в домашни офиси и общуваха помежду си само цифрово. Следователно според Франке „Проектът показва, че може да се създаде цифрова структура, която да улесни научната работа при тези условия“.

Източник:

Справка в списанието:

Домен, Дж., et al. (2022) Идентифициране на туморни клетки на едноклетъчно ниво с помощта на машинно обучение. Биология на генома. doi.org/10.1186/s13059‐022‐02683‐1.

.

Leave a Comment