You are here

    • You are here:
    • Home > Research > Protein behaviour can be predicted with simple maths

Protein behaviour can be predicted with simple maths

NewsNEWS

25
Sep
Wed, 25/09/2024 - 17:01

Protein behaviour can be predicted with simple maths

GRB2-SH3 is a protein with 34 amino acids, meaning there are 17 billion different combinations if only a single change allowed at each position. Credit: Aina Martí Aranda

In a study published today in the journal Nature, researchers from the Centre for Genomic Regulation (CRG) and the Wellcome Sanger Institute have discovered that mutations affect protein stability following remarkably simple rules. The discovery has profound implications for accelerating the development of new treatments for diseases or the design of new proteins with industrial applications.

Proteins are chains made up of twenty different types of smaller units called amino acids. A single mutation swaps one amino acid for another, changing the protein's shape. This can mark the difference between health and disease. Many diseases, including cancer and neurodegenerative disorders, are caused by more than one mutation in a protein.

Predicting how mutations alter a protein’s shape is critical for understanding their contribution to disease. However, with so many amino acids in a protein, there are an astronomical number of ways mutations can combine. Experimentally testing each possible combination to see how they affect a protein is practically impossible.

“There are 17 billion different combinations of a protein that is 34 amino acids in length with only a single change allowed at each position. If it took just one second to test a single combination, we’d need a total of 539 years to try them all. It’s not a feasible experiment,” says Aina Martí Aranda, co-author of the study who began the project at the CRG and is currently a PhD student at the Wellcome Sanger Institute in the UK.

As proteins get longer, the different number of combinations rises exponentially. For a protein one hundred amino acids long, there are more possible combinations than there are atoms in the entire universe. The vast majority of known proteins, especially those contributing to human disease, are much longer.

Even in this vast landscape of possibilities, research led by Dr. André Faure at the Centre for Genomic Regulation in Barcelona and ICREA Research Professor Ben Lehner, with dual affiliation between the CRG and the Wellcome Sanger Institute, have discovered that the impact of mutations on protein stability is more predictable than previously thought.

For years, there has been an underlying assumption that two mutations might interact with each other in unexpected ways, enhancing or suppressing each other’s effects. “The fear that two mutations interacting can unpredictably affect the whole structure made us use incredibly complex models,” says Martí Aranda.

The study found that while mutations do interact, it is a relatively rare occurrence, and the vast majority affect a protein independently of each other. “Our discovery turns an old understanding on its head, showing that the endless possibilities of protein mutations boil down to straightforward rules. We don't need supercomputers to predict a protein’s behaviour – just good measurements and simple maths will do,” says Dr. Lehner.

The researchers made the discovery by generating thousands of protein variants, each with different combinations of mutations that could produce functional proteins. They then tested the stability of the proteins, generating a vast amount of data on how each mutation and combination of mutations affect proteins. The experimental outcomes closely matched models which assume that the total effect of multiple mutations can be calculated by simply adding up the effects of each individual mutation.

The findings can help better understand and target genetic diseases. For example, some genetic disorders are caused by many mutations in one protein. Patients may have different combinations of mutations, making it challenging to predict disease severity and response to treatments.

With the new understanding that most mutations act independently, clinicians can find new ways of predicting how various mutation combinations affect a protein's stability and function. This can lead to more accurate prognoses and personalised treatment plans, improving patient outcomes.

The study can also lead to more efficient drug development. Some drugs correct misfolded proteins, such as in Alzheimer's disease, where the changing shape of amyloid-beta proteins form plaques in the brain. Researchers can now better predict which mutations are most destabilising and design molecules that specifically stabilise these regions.

The study also has implications for biotechnologists using protein design to tackle different types of problems. For example, some enzymes have the ability to break down plastics in the environment. Researchers could design new enzymes with enhanced activity and stability by adding beneficial mutations together.

While the discovery is a significant advance, the researchers raise some limitations in the study. For example, they did not capture more complex interactions involving three or more mutations. In some proteins, these higher-order interactions could significantly impact stability and are not predicted by simply adding up individual effects.

Also, while the findings can dramatically reduce the number of experiments needed, some level of experimental validation is still necessary to confirm predictions, especially for critical applications like drug development where there may be unforeseen effects or rare interactions that the models do not capture.

EN CASTELLANO

Simples cálculos pueden predecir la estabilidad de las proteínas  

En un estudio publicado hoy en la revista Nature, un equipo científico del Centro de Regulación Genómica (CRG) y el Wellcome Sanger Institute ha descubierto que las mutaciones afectan a la estabilidad de las proteínas siguiendo reglas muy sencillas. El hallazgo tiene profundas implicaciones para acelerar el desarrollo de nuevos tratamientos para enfermedades o el diseño de nuevas proteínas con aplicaciones industriales.

Las proteínas son cadenas formadas por veinte tipos diferentes de aminoácidos. Una sola mutación cambia un aminoácido por otro, y esto modifica la forma de la proteína. Esto puede marcar la diferencia entre la salud y la enfermedad. Muchas enfermedades, como el cáncer y los trastornos neurodegenerativos, están causadas por más de una mutación en una proteína. 

Predecir cómo las mutaciones alteran la forma de una proteína es fundamental para comprender su contribución a la enfermedad. Sin embargo, con tantos aminoácidos en una proteína, hay un número astronómico de combinaciones de mutaciones. Probar cada combinación posible para ver cómo afectan a una proteína es prácticamente imposible. 

"Permitiendo solo un cambio en cada posición, hay 17.000 millones de combinaciones diferentes en una proteína de 34 aminoácidos de longitud. Si tuviéramos un segundo para probar una sola combinación, tardaríamos un total de 539 años para probarlas todas. No es un experimento factible", afirma Aina Martí Aranda, coautora del estudio, que inició el proyecto en el CRG y actualmente es estudiante de doctorado en el Wellcome Sanger Institute del Reino Unido.

A medida que las proteínas se hacen más largas, el número de combinaciones aumenta exponencialmente. Para una proteína de cien aminoácidos de largo, hay más combinaciones posibles que átomos en todo el universo. La gran mayoría de las proteínas, especialmente las que contribuyen a las enfermedades humanas, son mucho más largas.

Incluso en este vasto panorama de posibilidades, la investigación liderada por el Dr. André Faure en el Centro de Regulación Genómica de Barcelona y el profesor de investigación ICREA Ben Lehner, con doble afiliación entre el CRG y el Wellcome Sanger Institute, han descubierto que el impacto de las mutaciones en la estabilidad de las proteínas es más predecible de lo que se pensaba.

Durante años, ha existido la idea de que dos mutaciones podrían interactuar entre sí de maneras inesperadas, aumentando o suprimiendo los efectos de la otra. "El miedo a que la interacción de dos mutaciones pueda afectar de forma impredecible a toda la estructura nos hizo utilizar modelos increíblemente complejos", explica Martí Aranda. 

El estudio reveló que, si bien las mutaciones interactúan, es un hecho relativamente raro, y la gran mayoría afectan a la proteína de forma independiente. "Nuestro descubrimiento da la vuelta a una vieja teoría, mostrando que las infinitas posibilidades de las mutaciones de las proteínas se reducen a reglas sencillas. No necesitamos supercomputadoras para predecir el comportamiento de una proteína, solo buenas mediciones y matemáticas simples hacen el resto", dice el Dr. Lehner.

El equipo hizo el descubrimiento generando miles de variantes de proteínas, cada una con diferentes combinaciones de mutaciones que podrían producir proteínas funcionales. A continuación, probaron la estabilidad de las proteínas, generando una gran cantidad de datos sobre cómo cada mutación y combinación de mutaciones afecta a las proteínas. 

Los resultados experimentales coincidieron de cerca con modelos que asumen que el efecto total de múltiples mutaciones se puede calcular simplemente sumando los efectos de cada mutación individual.

Los hallazgos pueden ayudar a comprender mejor y abordar las enfermedades genéticas. Por ejemplo, algunos trastornos genéticos son causados por muchas mutaciones en una proteína. Los pacientes pueden tener diferentes combinaciones de mutaciones, lo que constituye un desafío para predecir la gravedad de la enfermedad y la respuesta a los tratamientos.

Con la nueva conclusión de que la mayoría de las mutaciones actúan de forma independiente, se pueden encontrar nuevas formas de predecir cómo las diversas combinaciones de mutaciones afectan a la estabilidad y a la función de una proteína. Esto puede llevar a pronósticos más precisos y planes de tratamiento personalizados, mejorando los resultados de los pacientes.

El estudio también puede llevar a un desarrollo de fármacos más eficiente. Algunos fármacos corrigen las proteínas mal plegadas, como en la enfermedad de Alzheimer, donde la forma cambiante de las proteínas beta-amiloides forman placas en el cerebro. Ahora se podría predecir mejor qué mutaciones son más desestabilizadoras y diseñar moléculas que estabilicen estas regiones.

El estudio también tiene implicaciones para los biotecnólogos que utilizan el diseño de proteínas para abordar diferentes retos. Por ejemplo, algunas enzimas tienen la capacidad de descomponer los plásticos en el medio ambiente. Se podrían diseñar nuevas enzimas con mayor actividad y estabilidad mediante la adición de mutaciones beneficiosas.

Si bien el estudio supone un avance significativo, los autores plantean algunas limitaciones a su trabajo. Por ejemplo, no capturaron interacciones más complejas que involucraban tres o más mutaciones. En algunas proteínas, estas interacciones de orden superior podrían afectar significativamente a la estabilidad y no se predicen simplemente sumando los efectos individuales.

Además, aunque los hallazgos pueden reducir drásticamente el número de experimentos necesarios, aún será necesario cierto nivel de validación experimental para confirmar las predicciones, especialmente para aplicaciones críticas como el desarrollo de medicamentos, donde puede haber efectos imprevistos o interacciones raras que los modelos no capturan.

EN CATALÀ

Simples càlculs poden predir l'estabilitat de les proteïnes

En un estudi publicat avui a la revista Nature, un equip científic del Centre de Regulació Genòmica (CRG) i el Wellcome Sanger Institute ha descobert que les mutacions afecten l'estabilitat de les proteïnes seguint regles molt senzilles. 

La troballa té profundes implicacions per accelerar el desenvolupament de nous tractaments per a malalties o el disseny de noves proteïnes amb aplicacions industrials.

Les proteïnes són cadenes formades per vint tipus diferents d'aminoàcids. Una sola mutació canvia un aminoàcid per un altre, i això modifica la forma de la proteïna. Això pot marcar la diferència entre la salut i la malaltia. Moltes malalties, com el càncer i els trastorns neurodegeneratius, estan causades per més d'una mutació en una proteïna.

Predir com les mutacions alteren la forma d'una proteïna és fonamental per comprendre la seva contribució a la malaltia. No obstant això, amb tants aminoàcids en una proteïna, hi ha un nombre astronòmic de combinacions de mutacions. Provar cada combinació possible per veure com afecten una proteïna és pràcticament impossible.

"Permetent només un canvi en cada posició, hi ha 17.000 milions de combinacions diferents en una proteïna de 34 aminoàcids de longitud. Si tinguéssim un segon per provar una sola combinació, trigaríem un total de 539 anys per provar-les totes. No és un experiment factible", afirma l’Aina Martí Aranda, coautora de l'estudi, que va iniciar el projecte al CRG i actualment és estudiant de doctorat al Wellcome Sanger Institute del Regne Unit.

A mesura que les proteïnes es fan més llargues, el nombre de combinacions augmenta exponencialment. Per a una proteïna de cent aminoàcids de llarg, hi ha més combinacions possibles que àtoms en tot l'univers. La gran majoria de les proteïnes, especialment les que contribueixen a les malalties humanes, són molt més llargues.

Fins i tot en aquest vast panorama de possibilitats, la investigació liderada pel Dr. André Faure al Centre de Regulació Genòmica de Barcelona i el professor de recerca ICREA Ben Lehner, amb doble afiliació entre el CRG i el Wellcome Sanger Institute, han descobert que l'impacte de les mutacions en l'estabilitat de les proteïnes és més predictible del que es pensava.

Durant anys, ha existit la idea que dues mutacions podrien interactuar entre si de maneres inesperades, augmentant o suprimint els efectes de l'altra. "La por que la interacció de dues mutacions pugui afectar de forma impredictible tota l'estructura ens va fer utilitzar models increïblement complexos", explica Martí Aranda.

L'estudi va revelar que, si bé les mutacions interactuen, és un fet relativament rar, i la gran majoria afecten la proteïna de forma independent. "El nostre descobriment dona la volta a una vella teoria, mostrant que les infinites possibilitats de les mutacions de les proteïnes es redueixen a regles senzilles. No necessitem supercomputadores per predir el comportament d'una proteïna, només bons mesuraments i matemàtiques simples fan la resta", diu el Dr. Lehner.

L'equip va fer el descobriment generant milers de variants de proteïnes, cadascuna amb diferents combinacions de mutacions que podrien produir proteïnes funcionals. A continuació, van provar l'estabilitat de les proteïnes, generant una gran quantitat de dades sobre com cada mutació i combinació de mutacions afecta les proteïnes. 

Els resultats experimentals van coincidir de prop amb models que assumeixen que l'efecte total de múltiples mutacions es pot calcular simplement sumant els efectes de cada mutació individual.

Les troballes poden ajudar a comprendre millor i abordar les malalties genètiques. Per exemple, alguns trastorns genètics són causats per moltes mutacions en una proteïna. Els pacients poden tenir diferents combinacions de mutacions, cosa que constitueix un desafiament per predir la gravetat de la malaltia i la resposta als tractaments.

Amb la nova conclusió que la majoria de les mutacions actuen de forma independent, es poden trobar noves formes de predir com les diverses combinacions de mutacions afecten l'estabilitat i la funció d'una proteïna. Això pot dur a pronòstics més precisos i plans de tractament personalitzats, millorant els resultats dels pacients.

L'estudi també pot dur a un desenvolupament de fàrmacs més eficient. Alguns fàrmacs corregeixen les proteïnes mal plegades, com en la malaltia d'Alzheimer, on la forma canviant de les proteïnes beta-amiloides formen plaques al cervell. Ara es podria predir millor quines mutacions són més desestabilitzadores i dissenyar molècules que estabilitzin aquestes regions.

L'estudi també té implicacions per als biotecnòlegs que utilitzen el disseny de proteïnes per abordar diferents reptes. Per exemple, alguns enzims tenen la capacitat de descompondre els plàstics en el medi ambient. Es podrien dissenyar nous enzims amb més activitat i estabilitat mitjançant l'addició de mutacions beneficioses. 

Si bé l'estudi suposa un avenç significatiu, els autors plantegen algunes limitacions al seu treball. Per exemple, no van capturar interaccions més complexes que involucraven tres o més mutacions. En algunes proteïnes, aquestes interaccions d'ordre superior podrien afectar significativament  l'estabilitat i no es prediuen simplement sumant els efectes individuals.

A més, tot i que les troballes poden reduir dràsticament el nombre d'experiments necessaris, encara serà necessari cert nivell de validació experimental per confirmar les prediccions, especialment per a aplicacions crítiques com el desenvolupament de medicaments, on hi pot haver efectes imprevistos o interaccions rares que els models no capturen.