Поделиться этой записью
Это мощнейший прорыв в биологии за последние несколько лет, эта нейросеть умеет генерировать ДНК, РНК и белки! Evo-1 может создавать последовательности даже полногеномного масштаба! ИИ сможет проектировать новые бактерии для лечения болезней и создавать новые гены.
Геном представляет собой последовательность, которая полностью закодирована в ДНК, РНК и белках, контролирующих работу всего организма. Прогресс в области машинного обучения, в комбинации с обширными наборами данных целых геномов, может возможно создать биологическую базовую модель, ускоряющую механистическое понимание и генеративное проектирование сложных молекулярных взаимодействий. В данном исследовании представлена модель Evo, которая работает на уровне генома и молекулы, позволяя прогнозировать и генерировать информацию. Используя передовые методы глубокой обработки сигналов, Evo был расширен до 7 миллиардов параметров с длиной контекста 131 килобаз (kb) с разрешением одного нуклеотида, байта. Обученная на целых прокариотических геномах, Evo способна обобщать информацию по трем модальностям центральной догмы молекулярной биологии для прогнозирования функций “с нуля”, превосходя в этои области ведущие модели языка, специализированные на домен. Evo также успешно выполняет задачи по генерации многих элементов, что продемонстрировано созданием синтетических молекулярных комплексов CRISPR-Cas и целых транспозабельных систем впервые. Путём использования информации, полученной на протяжении всего генома, Evo также может предсказывать важность генов с точностью до нуклеотида и генерировать кодирующие последовательности длиной до 650 тыс. баз, что является порядком длиннее, чем предыдущие методы. Продвижения в мульти-модальном и мульти-масштабном обучении с использованием модели Evo предоставляют перспективный путь к улучшению понимания и контроля биологических процессов на различных уровнях сложности.