[:ru]Применяя неконтролируемые и автоматизированные методы машинного обучения для анализа миллионов раковых клеток, Ребекка Ири и Джонатан Ириш, оба доцентов по биологии клеток и биологии развития, выявили новые типы раковых клеток в опухолях головного мозга. Машинное обучение — это серия компьютерных алгоритмов, которые могут определять шаблоны в огромных объемах данных и становиться «умнее» с большим опытом. Это открытие позволяет ученым лучше понять и нацелить эти типы клеток на исследования и терапию глиобластомы — агрессивной опухоли головного мозга с высокой смертностью, а также на более широкое применение машинного обучения для исследований рака.
Вместе со своими сотрудниками Ihrie и Irish разработали RenID (ID) для оценки риска (RAPID) — алгоритм машинного обучения с открытым исходным кодом , который выявил скоординированные паттерны экспрессии и модификации белка, связанные с результатами выживания.
23 июня в журнале eLife была опубликована статья «Необслуживаемое машинное обучение, которое выявляет риск расслоения опухолевых клеток глиобластомы» . Код и примеры RAPID доступны на странице цитолаба Github.
В течение последнего десятилетия исследовательское сообщество работало над тем, чтобы использовать способность машинного обучения поглощать и анализировать больше данных для исследования раковых клеток, чем может обработать только человеческий разум . «Без какого-либо человеческого контроля RAPID прошел через 2 миллиона опухолевых клеток — по крайней мере, с 4 710 клетками глиобластомы от каждого пациента — из 28 глиобластом, отмечая самые необычные клетки и паттерны, на которые мы можем смотреть», — сказал Ири. «Мы можем найти иголки в стоге сена, не обыскивая весь стог сена. Эта технология позволяет нам сосредоточиться на лучшем понимании наиболее опасных раковых клеток и приблизиться к окончательному излечению рака мозга».
В RAPID были введены данные о клеточных белках, которые определяют идентичность и функцию нервных стволовых клеток и других клеток мозга. Используемый тип данных называется одноклеточной масс-цитометрией, методом измерения, обычно применяемым при раке крови. После того, как статистический анализ RAPID был завершен и были обнаружены «иголки в стоге сена», были изучены только эти клетки. «Один из самых впечатляющих результатов нашего исследования заключается в том, что неконтролируемое машинное обучение обнаружило, что клетки худшего нарушителя не требуют от исследователей предоставления им клинических или биологических знаний в качестве контекста», — сказал Ирриш, также научный директор Vanderbilt’s Cancer & Immunology Core. «Результаты этого исследования в настоящее время представляют собой самый большой прогресс в биологии из моей лаборатории в Вандербильте».[:]