Ferramenta com inteligência artificial prevê novas reações entre enzimas e moléculas sintéticas

Um novo modelo baseado em aprendizado de máquina promete reduzir os gargalos no desenvolvimento de reações biocatalíticas ao prever, com alto grau de precisão, a compatibilidade entre enzimas e moléculas-alvo. A iniciativa é resultado de uma colaboração entre pesquisadores das universidades de Rochester e Michigan, que construíram um banco de dados experimental com mais de 100.000 reações entre uma centena de moléculas e uma biblioteca de 300 enzimas do tipo α-ketoglutarato non-heme iron(II)-dependent (α-KG-NHI).

O desafio central da pesquisa era encontrar pontos de partida viáveis para transformar moléculas-alvo — muitas vezes de origem sintética — usando enzimas que, na natureza, apresentam funções distintas. Reações catalisadas por enzimas são cada vez mais requisitadas por oferecer processos mais limpos e seletivos, mas exigem extensos testes para encontrar o catalisador ideal. Segundo os autores, esse processo de triagem é dispendioso e lento, criando um obstáculo para a expansão da biocatálise em larga escala.

Para contornar esse problema, os cientistas reuniram uma ampla diversidade de dados experimentais com enzimas da família α-KG-NHI testadas contra compostos que vão de aminoácidos naturais até esteroides sintéticos. A partir dessas informações, desenvolveram dois modelos computacionais que conseguiram identificar mais de 200 reações previamente desconhecidas. Com a base em mãos, criaram a CATNIP, uma ferramenta online gratuita capaz de sugerir quais enzimas são promissoras para reagirem com determinados compostos químicos, e vice-versa.

CATNIP permite que qualquer usuário envie a estrutura de uma pequena molécula e receba, em minutos, uma lista ordenada de enzimas potencialmente competentes para catalisar reações oxidativas com aquele substrato. Também é possível submeter uma sequência enzimática para descobrir com quais substratos ela pode reagir. Nos testes, a ferramenta foi usada para prever reações com compostos de complexidade variada, e as reações previstas se mostraram viáveis em laboratório.

Diferente de abordagens anteriores que se apoiam fortemente em dados biossintéticos de um-para-um (uma enzima, um substrato), o modelo atual traçou uma rede de compatibilidade integrada entre os espaços de sequência proteica e estrutura química. Isso permitiu extrapolar a compatibilidade além dos dados existentes, expandindo o alcance para novos pares enzima-substrato. A rede funcionou como um mapa, possibilitando interpolar entre regiões da proteína e da química ainda inexploradas.

Entre os impactos pretendidos, os autores destacam a capacidade de fornecer pontos de partida mais robustos para campanhas de evolução dirigida de enzimas. Segundo Alexandra E. Paton, uma das autoras, a abordagem pode facilitar o uso de biocatalisadores por químicos não especialistas ao reduzir o risco associado à escolha das enzimas iniciais. A expectativa é que esse modelo se torne uma etapa padronizada na triagem de reações biológicas aplicáveis à síntese industrial de moléculas complexas.

Os pesquisadores planejam expandir o modelo para além da família específica de enzimas utilizada na pesquisa inicial, cobrindo também outras classes de proteínas e estruturas químicas ainda não testadas. Essa ampliação deve aumentar o alcance do modelo, consolidando seu papel como ferramenta preditiva para descoberta racional de biotecnologias aplicadas.

De acordo com Bettina Nestl, pesquisadora da Innophore na Áustria e especialista em biocatálise, o artigo apresenta uma estratégia original para prever reações enzimáticas sem a necessidade de testes exaustivos em laboratório. A integração entre bioinformática e química representa, segundo ela, um avanço importante para tornar mais eficiente a seleção de biocatalisadores.

O entusiasmo da comunidade já é sentido. Após o lançamento da ferramenta, os autores relatam um crescimento no interesse por testar reações mediadas por enzimas ainda pouco exploradas. CATNIP está disponível publicamente e pode ser acessada em: https://go.nature.com/46dqngt.

Fonte: Machine learning matches enzymes with molecular substrates

Compartilhar