What once took months now takes days
No cruzamento entre biologia e inteligência artificial, o Biohub de Mark Zuckerberg e Priscilla Chan lançou um sistema capaz de projetar proteínas terapêuticas em dias — não meses — abrindo um novo capítulo na medicina de precisão. Treinado em 2,8 bilhões de sequências proteicas de todas as formas de vida conhecidas, o modelo ESMC representa uma tentativa de decifrar a linguagem evolutiva da biologia para combater cânceres e doenças imunológicas. É um momento em que a velocidade da máquina encontra a paciência da ciência, com implicações que vão muito além de qualquer laboratório individual.
- Encontrar a proteína certa para tratar um câncer pode levar meses de tentativas e erros — o novo sistema do Biohub comprime esse processo para dois dias.
- Alvos moleculares como EGFR, PD-L1 e CTLA-4, centrais no combate ao câncer, foram usados para validar o sistema, e os candidatos mais promissores se ligaram com sucesso a seus alvos em laboratório.
- A escala é vertiginosa: o ESM Atlas reúne 6,8 bilhões de sequências proteicas e 1,1 bilhão de estruturas previstas, enquanto o ESMC foi treinado em quase toda a diversidade proteica da vida na Terra.
- As ferramentas estão disponíveis gratuitamente para pesquisadores em qualquer lugar do mundo, democratizando um campo que antes exigia recursos imensos.
- A pergunta que permanece não é se a tecnologia funciona — os testes laboratoriais respondem isso — mas em quanto tempo ela transformará o desenvolvimento de medicamentos em realidade clínica.
O Biohub, fundado por Mark Zuckerberg e Priscilla Chan, anunciou discretamente o lançamento de um sistema de inteligência artificial projetado para entender e criar proteínas capazes de tratar cânceres e distúrbios imunológicos. A divulgação foi feita no site da organização, mas o que ela representa é considerável: uma mudança profunda na forma como cientistas podem abordar um dos problemas mais lentos e custosos da medicina moderna.
Proteínas são os motores da biologia — transportam oxigênio, combatem vírus, regulam células e sustentam o sistema imunológico. Apesar de décadas de pesquisa, milhares delas permanecem mal compreendidas. O sistema ESMC foi desenvolvido para aprender com os padrões evolutivos inscritos nas sequências proteicas e usar esse conhecimento para prever, mapear e projetar novas proteínas com precisão cirúrgica.
O sistema é composto por três ferramentas integradas: o ESMFold2, que prevê e projeta estruturas proteicas; o ESM Atlas, banco de dados com 6,8 bilhões de sequências e 1,1 bilhão de estruturas previstas; e o ESMC, um modelo de linguagem treinado em 2,8 bilhões de sequências extraídas de todas as formas de vida conhecidas. Juntas, essas ferramentas permitem simular milhares de proteínas candidatas antes de qualquer experimento físico.
Para demonstrar a capacidade do sistema, a equipe do Biohub selecionou três alvos moleculares ligados ao crescimento tumoral e à função imune — EGFR, PD-L1 e CTLA-4. Em aproximadamente dois dias, a IA gerou dezenas de milhares de proteínas candidatas e as classificou por estabilidade e potencial terapêutico. Quando os candidatos mais promissores foram testados em laboratório, alguns se ligaram com sucesso aos seus alvos em configurações estáveis, confirmando o potencial real da abordagem.
O que antes exigia meses de tentativa e erro agora leva dias. As ferramentas estão disponíveis para qualquer pesquisador no mundo, sem barreiras de acesso. A validação laboratorial já foi feita — o que resta saber é com que velocidade essa tecnologia percorrerá o caminho do conceito à clínica, e se ela irá, de fato, redesenhar o tempo do desenvolvimento de medicamentos da forma que promete.
Mark Zuckerberg and Priscilla Chan's Biohub announced the release of a new artificial intelligence system trained to understand how proteins work and design new ones that could treat cancer and immune disorders. The announcement came quietly, posted to the company's website, but it represents a significant shift in how scientists might approach one of medicine's most painstaking problems: finding the right protein to bind to the right target in a patient's body.
Proteins are the workhorses of biology. They carry oxygen through the bloodstream, fight off viruses, build muscle tissue, regulate cells, and strengthen immune defenses. Yet despite decades of research, thousands of proteins remain poorly understood. Their functions stay hidden. The new AI system, called ESMC, is designed to learn from the evolutionary patterns embedded in protein sequences and use that knowledge to predict, map, and design proteins with precision.
The Biohub system actually consists of three interconnected tools. ESMFold2 predicts protein structures and enables the design of new ones. ESM Atlas is a vast database containing 6.8 billion protein sequences and 1.1 billion predicted structures. ESMC itself is a language model trained on approximately 2.8 billion protein sequences drawn from every form of life on Earth. The company says the AI can help develop proteins that bind to specific molecular targets with high affinity—a capability that was tested against five clinically relevant targets in cancer and immunology.
The potential application is straightforward but transformative. Currently, when researchers want to create a protein-based treatment—say, an antibody to fight cancer—they must laboriously discover which protein binds to the right target and whether it does so with enough precision and strength. This is the foundation of precision medicine, but it is also expensive and slow. With the AI, researchers can simulate thousands of candidate proteins in silico, predict which ones are most likely to work, and narrow the field before ever entering a laboratory.
To demonstrate this capability, the Biohub team selected three protein targets linked to cancer growth and immune function: EGFR, PD-L1, and CTLA-4. The AI generated tens of thousands of potential proteins in roughly two days, then ranked them by stability and therapeutic likelihood. When the most promising candidates were tested in actual laboratory conditions, some successfully bound to their targets in stable configurations, showing real therapeutic potential. As computational power increased, success rates improved, particularly for the most difficult binding challenges.
The speed is the revelation. What once took months of trial and error now takes days. The Biohub statement emphasizes that while diseases follow common patterns, much of illness is individual. For conditions like cancer and rare genetic disorders, the impact could be immediate. The tools are now available to any researcher anywhere, democratizing access to protein design in a way that was impossible before. The question now is not whether this technology works—the laboratory validation answers that—but how quickly it will move from proof of concept to clinical reality, and whether it will reshape the timeline of drug development as fundamentally as it promises.
Notable Quotes
We demonstrated that the ESM can design protein ligands validated in the laboratory for five clinically relevant targets in just a few days. What this work changes is the speed of the initial phase of this process, made possible because these tools are now available to any researcher, anywhere, who wants to use them.— Biohub statement
The Hearth Conversation Another angle on the story
So the AI didn't just predict protein structures—it actually designed new ones that worked in the lab?
Yes. It generated tens of thousands of candidates computationally, ranked them, and when they tested the best ones in the lab, some actually bound to their targets correctly. That's the validation piece that matters.
How much faster is this than the old way?
The old approach could take months just to find a candidate worth testing. This system did it in two days. The real time savings is in that initial discovery phase—the part that used to be pure guesswork.
But this is still early stage, right? These are validated in labs, not in patients yet.
Correct. It's a proof of concept. But the fact that it worked at all on clinically relevant targets—cancer proteins, immune checkpoints—that's significant. It shows the AI learned something real about how proteins work.
Who gets to use this?
That's the other part of the announcement. They're making it available to researchers everywhere. It's not locked behind a paywall or a corporate partnership. That's the democratization piece.
Why does that matter?
Because protein design used to require massive computational resources and institutional backing. Now a lab in São Paulo or Seoul can run the same simulations as a lab at Stanford. It changes who gets to participate in drug discovery.