Дэвид Бейкер долгое время был далек от биологии и вряд ли что-то слышал о проблеме предсказания структуры белков. Фото Reuters
Нобелевская премия по химии в этом году присуждена за решение проблемы, мучившей всех биологов и протеинщиков в частности, начиная, можно сказать, с 1902 года, когда наградили немца Эмиля Фишера, члена Петербургской академии наук. Именно он заявил, что белки состоят из разных аминокислот, представляющих собой уксусную кислоту с аминогруппой – NH2. Определять последовательность аминокислот в белковых цепях научились только в начале 1950-х.
И тут во всей своей красе вновь стала Проблема! Накопленный пул рентгеновских структур и аминокислотных последовательностей обещал быстрое и логичное решение проблемы получения пространственных форм белков. К тому же все шире стали использовать суперкомпьютеры. В мощной технике видели панацею от кажущейся нерешаемости вопроса, постулированной матлогикой, утверждавшей, что белок из всего лишь 100 аминокислот может принимать 1047 возможных форм.
«Предвкушение» близкого решения породило феномен Critical Assesment of protein Structure Problem (CASP, Критическая оценка проблемы структуры белка). Это вылилось в соревнование, в ходе которого суперкомпьютерщики представляли свои «модели». Соответствие их реальным «рентгенограммам» не превышало 40%, что никого не могло удовлетворить.
Ситуация, естественно, не удовлетворяла британца, одного из основателей компании по исследованию искусственного интеллекта DeepMind Демиса Хассабиса. Кстати, компьютерная программа, которую эта компания разработала, сначала обыграла чемпиона мира по шахматам, а затем по игре Го. На доске шахматной Демис играл с четырех лет, а к 13 стал мастером (гроссмейстером). К 2018 году он на CASP достиг рекорда в 60% соответствия, но после этого вынужден был признать, что работа зашла в тупик.
Джон Джампер начинал как физик-теоретик, защитив диссертацию, и принимал участие в решении проблемы предсказания структуры белков. В 2017-м он узнал, что британцы начали, не афишируя, решать эту проблему. Джампер предложил свое резюме лондонцам. Так возник тандем, который и предложил новую версию AF2 (AlphaFold) – сложение-складывание альфа-спиралей, структура которых труднее предсказывается. В 2020 году организаторы CASP были вынуждены признать, что новый подход дает разрешение выше 90% достоверности и соответствий рентгену.
Демис Хассабис и Джон Джампер разработали модель ИИ для решения 50-летней проблемы: предсказания сложных структур белков. Фото Reuters |
Третий нобелевский лауреат, Дэвид Бейкер, был далек от биологии и вряд ли что слышал о проблеме предсказания структуры белков, когда начинал изучать в Гарварде философию и социальные науки. Но так получилось, что он прочитал книгу «Молекулярная биология клетки». В 1993 году заинтересовался в университете штата Вашингтон в Сиэтле механизмом белкового фолдинга. Он считается ветераном проблемы предсказания, поскольку участвовал в CASP уже через пять лет.
Следует учитывать, что Бейкер пошел против научного мейнстрима, предложив реверсивный DND, или дизайн белков заново – de novo. Свой подход он назвал «Розетта» и предлагал отталкиваться не от аминокислотных последовательностей, а от желательных структур, для которых с помощью компьютера «подгонял» те или иные цепочки аминокислот. Так был создан первый из несуществующих в природе белков из 93 аминокислот. Автор-дизайнер назвал свое творение Тор7.
На пресс-конференции, организованной по случаю объявления нобелевских лауреатов, Бейкер подчеркнул «силу искусственного интеллекта». «ИИ предлагает более эффективные методы исследования, чем традиционная наука», – сказал Бейкер.
Что дальше, задаются вопросом ученые, которые уже сегодня имеют в своем распоряжении 200 млн виртуальных структур протеинов. Сейчас, в преддверии прихода квантовых компьютеров, можно говорить о том, что созданные нейросетями белки не делают бесполезным рентгеноструктурный анализ, но существенно ускоряют процесс. Можно вспомнить нобелевского лауреата Макса Перутца (1962), который говорил, что на решение 3D-проблемы гемоглобина у него ушло 25 лет.
Нечто похожее имеет место при проникновении вирусов, что стало широко известно в недавнюю пандемию. Если научиться менять или просто предсказывать структуру взаимодействующих протеинов, то человечество, потенциально, может быть избавлено от инфекционных заболеваний. То же относится и к раку, который пытаются лечить с помощью генетически модифицированных, несущих химерный рецептор, повышающий активность Т-лимфоцитов.
И так до бесконечности можно перечислять области применения известных 3D-структур белков, которые благодаря ИИ научились предсказывать лауреаты премии по химии, не являющиеся химиками по определению.