Новый AI DeepMind, возможно, только что решил «величайшую проблему в биологии»

Когда дело доходит до жизни, белки — это все. Производство белков из генов лежит в основе каждого клеточного процесса, каждой разницы в внешнем виде человека, каждого движения, которое вы делаете.

Производство этих белков зависит от сложной системы складывания аминокислот (строительных блоков, производимых нашим генетическим кодом) снова и снова, чтобы создать сложные структуры, которые определяют, как белок будет действовать и на что он будет действовать.

Несмотря на огромные скачки и технологические достижения в изучении белков, от ученых ускользнуло понимание того, как белки складываются и какую форму образует простой аминокислотный код. Это называется «проблемой сворачивания белка» и является одной из самых серьезных проблем биологии.

Новый AI DeepMind, возможно, только что решил «величайшую проблему в биологии»

Тем не менее, благодаря прорыву, сделанному командой AlphaFold британской компании DeepMind в области искусственного интеллекта, ученые считают, что они нашли решение в ИИ.

Провозглашенная достижением, которое «изменит биологию и медицину», система глубокого обучения может смоделировать белковые структуры, используя только код аминокислоты, что обычно требует целых докторов наук.

«Мы застряли на одной проблеме — как складываются белки — почти 50 лет. Видеть, как DeepMind предлагает решение для этой проблемы, так как лично работая над этой проблемой так долго и после стольких остановок и запусков, задаваясь вопросом, доберемся ли мы когда-нибудь до этого, — это особенный момент », — сказал профессор Джон Моулт, соучредитель. и председатель отдела критической оценки предсказания структуры белка (CASP).

Известно, что белковые структуры сложно определить. Наши текущие методы включают рентгеновскую кристаллографию, которая включает в себя кристаллизацию образца белка перед его рентгеновским отображением и сбор данных электронной плотности для создания трехмерной структуры или криоэлектронную микроскопию, при которой образцы замораживаются до криогенных температур перед визуализацией трехмерных изображений.

Они дали нам впечатляющее представление о структурах белков, но некоторые белки невозможно визуализировать таким образом, и оба требуют много времени и невероятно дороги.

Наряду с этим, оба метода никогда не решат проблему сворачивания белка, поскольку они отображают только образцы, представленные перед ними — что, если вы хотите предсказать структуру белка по его аминокислотной последовательности?

Вместо этого исследователи попробовали другой подход — они создали онлайн-игру, в которой могут участвовать люди со всего мира. Игра, получившая название Foldit, представляла собой краудсорсинговую попытку предсказать сворачивание белка, позволяя пользователям предсказывать свою собственную форму белка для данной последовательности, с самой высокой оценкой модели. Каким бы новаторским ни был этот подход, он требует много времени, трудоемок и часто неточен.

Пытаясь решить эту проблему, DeepMind задействовал искусственный интеллект, чтобы делать то, что простые смертные не могут. Используя глубокое обучение, они создали управляемую искусственным интеллектом систему, которая может предсказывать белковые структуры на основе основных аминокислотных последовательностей с невероятной степенью точности за сравнительно короткое время, всего за несколько дней.

«Мы обучили эту систему на общедоступных данных, состоящих из ~ 170 000 структур белков из банка данных белков вместе с большими базами данных, содержащих последовательности белков неизвестной структуры», — заявляют разработчики AlphaFold. «Он использует примерно 128 ядер TPUv3 (примерно эквивалентно ~ 100-200 графическим процессорам), работающим в течение нескольких недель, что является относительно скромным объемом вычислений в контексте большинства крупных современных моделей, используемых в машинах. учусь сегодня «.

Хотя официальные данные еще не были опубликованы, это объявление вызвало у научного сообщества пиковое волнение и привело к размышлениям о том, что это будет значить для структурной биологии.

Полное понимание сворачивания белка позволит сделать скачок вперед в таких областях, как медицина, что, возможно, позволит производить более эффективные и более индивидуализированные лекарства гораздо быстрее, чем когда-либо прежде.

«Эта вычислительная работа представляет собой потрясающий шаг вперед в решении проблемы сворачивания белков, грандиозной задаче биологии 50-летней давности. Это произошло на десятилетия раньше, чем предсказывали многие специалисты в этой области. Будет интересно увидеть множество способов, которыми это фундаментально изменит биологические исследования », — сказал профессор Венки Рамакришнан, лауреат Нобелевской премии и президент Королевского общества.