Нейронная сеть научилась искать лекарства от рака без помощи человека
Команда исследователей из нескольких компаний и институтов, среди которых МФТИ, впервые применила нейронную сеть для создания новых лекарственных препаратов, пишет Life.ru.
Сначала её обучали на базе молекул с известной противораковой активностью. Затем она улавливала закономерности в структуре этих молекул, не очевидные человеку, и искала определённые особенности в строении других молекул, активность которых по отношению к раковым клеткам ещё не известна.
Таким образом, нейросеть в автоматическом режиме искала кандидатов в новые лекарства. Этот подход способен в разы сокращать время и стоимость их поиска. Исследователи предполагают, что их детище сможет искать новые препараты против самых разных болезней, от опухолей до сердечно-сосудистых заболеваний. Соответствующая статья опубликована в Оncotarget.
Для проверки сети использовали патентную базу противораковых лекарств. Сначала обучали сеть на части лекарственных форм, а затем проверяли её на оставшихся лекарствах, которые ей ещё "не показывали". Задача была в том, чтобы предсказать такие действующие лекарственные формы, которых не было в обучающей выборке. В результате сети удалось предсказать 69 препаратов различных химических классов, среди которых ряд уже используется в борьбе с лейкемией и раком груди.
За основу архитектуры нейронной сети взяли состязательных автокодировщиков. Так называют расширения генеративных состязательных сетей. Сеть была составлена из трёх структурных элементов: кодировщика, декодера и дискриминатора.
Каждый элемент выполнял свою специфическую роль, "сотрудничая" с двумя другими. Кодировщик совместно с декодером обучался сжимать и затем восстанавливать информацию об исходной молекуле. Дискриминатор помогал сделать сжатое представление молекулы более подходящим для последующего восстановления.
Все молекулы имеют представление в виде "смайлзов" (SMILES) — буквенных аннотаций химического вещества, которые позволяют восстановить его структуру. Правда, SMILES не очень подходит для представления молекул нейросети, так как каждая аннотация имеет произвольную длину от одной до двухсот букв. А для обучения нейронной сети требуется одинаковая длина описания (вектора). Решает эту задачу фингерпринт (в переводе "отпечаток пальца") молекулы. "Отпечаток" содержит в себе всю информацию о молекуле.
Существует множество способов построения отпечатка. Исследователи использовали самый простой— бинарный из 166 цифр. Они конвертировали SMILES в "отпечатки" и на них уже обучали сеть. На вход нейронной сети подавались "отпечатки" известных лекарственных молекул. Сеть должна была распределить веса параметров внутренних нейронов (узлов нейросети, которые не следует путать с реальными нейронами живых существ) так, чтобы при заданном входе получился заданный же выход.
Нейросеть функционировала как "чёрный ящик", который умеет при заданном входе давать заданный выход. Затем разработчики убрали первые слои, и сеть генерировала "отпечатки" новых молекул при обратном прогоне уже сама. Учёные автоматизированными методами построили цифровые "отпечатки" для всех молекул в базе и далее сравнивали сгенерированные сетью "отпечатки" с уже имеющимися. Отобранные таким образом вещества в теории должны обладать заданными обучающей группой качествами.
На данный момент только доля процента от всего числа потенциально полезных химических соединений используется в лекарственных препаратах. Вручную искать среди миллионов вариантов принципиально новую молекулу, обладающую лечебными свойствами, долго и дорого. Нейросеть поможет удешевить процесс. Следующим этапом в эксплуатации нейросети должен стать поиск новых лекарств и проверка их возможностей в ходе клинических испытаний.