Human ‘Domainome’ Reveals Root Cause of Heritable Disease
Human ‘Domainome’ Reveals Root Cause of Heritable Disease
Most mutations which cause disease by swapping one amino acid out for another do so by making the protein less stable, according to a massive study of human protein variants published today in the journal Nature. Unstable proteins are more likely to misfold and degrade, causing them to stop working or accumulate in harmful amounts inside cells.
The work helps explain why minimal changes in the human genome, also known as missense mutations, cause disease at the molecular level. The researchers discovered that protein instability is one of the main drivers of heritable cataract formation, and also contributes to different types of neurological, developmental and muscle-wasting diseases.
Researchers at the Centre for Genomic Regulation (CRG) in Barcelona and BGI in Shenzhen studied 621 well-known disease-causing missense mutations. Three in five (61%) of these mutations caused a detectable decrease in protein stability.
The study looked at some disease-causing mutations more closely. For example, beta-gamma crystallins are a family of proteins essential for maintaining lens clarity in the human eye. They found that 72% (13 out of 18) of mutations linked to cataract formation destabilise crystallin proteins, making the proteins more likely to clump together and form opaque regions in the lens.
The study also directly linked protein instability to the development of reducing body myopathy, a rare condition which causes muscle weakness and wasting, as well as Ankyloblepharon-ectodermal defects-clefting (AEC) Syndrome, a condition characterised by the development of a cleft palate and other developmental symptoms.
However, some disease-causing mutations did not destabilise proteins and shed light on alternative molecular mechanisms at play.
Rett Syndrome is a neurological disorder which causes severe cognitive and physical impairments. It is caused by mutations in the MECP2 gene, which produces a protein responsible for regulating gene expression in the brain. The study found that many mutations in MECP2 do not destabilise the protein but are instead found in regions which affect how MECP2 binds to DNA to regulate other genes. This loss of function could be disrupting brain development and function.
"We reveal, at unprecedented scale, how mutations cause disease at the molecular level" says Dr. Antoni Beltran, first author of the study and researcher at the Centre for Genomic Regulation (CRG) in Barcelona. "By distinguishing whether a mutation destabilises a protein or alters its function without affecting stability, we can tailor more precise treatment strategies. This could mean the difference between developing drugs that stabilise a protein versus those that inhibit a harmful activity. It's a significant step toward personalised medicine."
The study also found that the way mutations cause disease often relates to whether the disease is recessive or dominant. Dominant genetic disorders occur when a single copy of a mutated gene is enough to cause the disease, even if the other copy is normal, while recessive conditions occur when an individual inherits two copies of a mutated gene, one from each parent.
Mutations causing recessive disorders were more likely to destabilise proteins, while mutations causing dominant disorders often affected other aspects of protein function, such as interactions with DNA or other proteins, rather than just stability.
For example, the study found that a recessive mutation in the CRX protein, which is important for eye function, destabilises the protein significantly, which could be causing heritable retinal dystrophies because the lack of a stable, functional protein impairs normal vision. However, two different types of dominant mutations meant the protein remained stable but functioned improperly anyway, causing retinal disease even though the protein's structure is intact.
The discoveries were possible thanks to the creation of Human Domainome 1, an enormous library of protein variants. The catalogue includes more than half a million mutations across 522 human protein domains, the bits of a protein which determine its function. It is the largest catalogue of human protein domain variants to date.
Protein domains are specific regions which can fold into a stable structure and perform a job independently of the rest of the protein. Human Domainome 1 was created by systematically changing each amino acid in these domains to every other possible amino acid, creating a catalogue of all possible mutations.
The impact of these mutations on protein stability was discovered by introducing mutated protein domains into yeast cells. The transformed yeast could only produce one type of mutated protein domain, and cultures were grown in test tubes under conditions which linked the stability of the protein to the growth of the yeast. If a mutated protein was stable, the yeast cell would grow well. If the protein was unstable, the yeast cell's growth would be poor.
Using a special technique, the researchers ensured only the yeast cells producing stable proteins could survive and multiply. By comparing the frequency of each mutation before and after the yeast growth, they determined which mutations led to stable proteins and which caused instability.
Though Human Domainome 1 is around 4.5 times bigger than previous libraries of protein variants, it still only covers 2.5% of known human proteins. As researchers increase the size of the catalogue, the exact contribution of disease-causing mutations to protein instability will become increasingly clear.
In the meantime, researchers can use the information from the 522 protein domains to extrapolate to proteins that are similar. This is because mutations often have similar effects on proteins that are structurally or functionally related. By analysing a diverse set of protein domains, the researchers discovered patterns in how mutations affect protein stability that are consistent across related proteins.
“Essentially, this means that data from one protein domain can help predict how mutations will impact other proteins within the same family or with similar structures. The 'rules' from these 522 domains are enough to help us make educated predictions about many more proteins than there are in the catalogue,” explains ICREA Research Professor Ben Lehner, with dual affiliation at the Centre for Genomic Regulation and the Wellcome Sanger Institute.
The study has limitations. The researchers examined protein domains in isolation rather than within full-length proteins. In living organisms, proteins interact with other parts of the protein and with other molecules in the cell. The study might not fully capture how mutations affect proteins in their natural habitat inside human cells. The researchers plan on overcoming this by studying mutations in longer protein domains, and eventually, full-length proteins.
"Ultimately, we want to map the effects of every possible mutation on every human protein. It’s an ambitious endeavour, and one that can transform precision medicine," concludes Dr. Lehner.
EN CASTELLANO
El 'Dominioma Humano’ explica la causa de varias enfermedades hereditarias
Las mutaciones que sustituyen un aminoácido por otro en la secuencia de una proteína pueden causar enfermedades. Un estudio publicado hoy en la revista Nature explica que esto sucede porque la mayoría de estas mutaciones desestabilizan la proteína que codifican.
Las proteínas inestables son más propensas a plegarse incorrectamente y degradarse, lo que provoca que dejen de funcionar o se acumulen en cantidades perjudiciales dentro de las células.
El estudio ayuda a explicar por qué cambios mínimos en el genoma humano, conocidos como mutaciones con cambio de sentido, causan enfermedades a nivel molecular. Demuestra que la inestabilidad proteica es uno de los principales impulsores de la formación de cataratas hereditarias y también contribuye a diferentes tipos de enfermedades neurológicas, del desarrollo y musculares.
Un equipo científico del Centro de Regulación Genómica (CRG) en Barcelona y del BGI en Shenzhen estudió 621 mutaciones con cambio de sentido conocidas por contribuir a diferentes tipos de enfermedad. Tres de cada cinco (61%) de estas mutaciones causaron una disminución detectable en la estabilidad de las proteínas.
El estudio examinó más de cerca algunas de estas mutaciones. Por ejemplo, las beta-gamma cristalinas son una familia de proteínas esenciales para mantener la claridad del cristalino en el ojo humano. Descubrieron que el 72% (13 de 18) de las mutaciones vinculadas a la formación de cataratas desestabilizan las proteínas cristalinas, haciendo que sea más probable que se agrupen y formen regiones opacas en el cristalino del ojo.
El estudio también vinculó la inestabilidad proteica con el desarrollo de la miopatía con cuerpos reductores, una afección rara que causa debilidad y desgaste muscular, así como con el síndrome de AEC o de Hay-Wells, que se caracteriza por la existencia de anquilobléfaron, displasia ectodérmica, fisura labiopalatina y otros síntomas del desarrollo.
Sin embargo, el estudio descubrió que algunas mutaciones causantes de enfermedades no desestabilizaban las proteínas, lo que puso de manifiesto la existencia de otros mecanismos moleculares implicados.
El síndrome de Rett es un trastorno neurológico que causa graves deficiencias cognitivas y físicas. Está causado por mutaciones en el gen MECP2, que produce una proteína responsable de regular la expresión génica en el cerebro. El estudio encontró que muchas mutaciones en MECP2 no desestabilizan la proteína, sino que se encuentran en regiones que afectan la forma en que MECP2 se une al ADN para regular otros genes. Esta pérdida de función podría estar alterando el desarrollo y funcionamiento del cerebro.
"Revelamos, a una escala sin precedentes, cómo las mutaciones causan enfermedades a nivel molecular", dice el Dr. Antoni Beltran, primer autor del estudio e investigador en el Centro de Regulación Genómica (CRG) en Barcelona. "Al distinguir si una mutación desestabiliza una proteína o altera su función sin afectar la estabilidad, podemos crear estrategias de tratamiento más precisas. Esto podría significar la diferencia entre desarrollar fármacos que estabilicen una proteína versus aquellos que inhiben una actividad perjudicial. Es un paso significativo hacia la medicina personalizada".
El estudio también encontró que la forma en que las mutaciones causan enfermedades a menudo depende de si la enfermedad es recesiva o dominante. Los trastornos genéticos dominantes ocurren cuando una sola copia de un gen mutado es suficiente para causar la enfermedad, incluso si la otra copia es normal, mientras que las condiciones recesivas ocurren cuando un individuo hereda dos copias de un gen mutado, una de cada progenitor.
Las mutaciones que causan trastornos recesivos tienen más probabilidades de desestabilizar las proteínas, mientras que las mutaciones que causan trastornos dominantes a menudo afectan otros aspectos de la función proteica, como las interacciones con el ADN u otras proteínas, en lugar de solo la estabilidad.
Por ejemplo, el estudio encontró que una mutación recesiva en CRX, importante para la función ocular, desestabiliza significativamente la proteína, lo que podría estar causando distrofias de retina hereditarias porque la falta de una proteína estable y funcional afecta la visión normal. Sin embargo, dos tipos diferentes de mutaciones dominantes hicieron que la proteína permaneciera estable, pero funcionara incorrectamente de todos modos, causando enfermedades retinianas a pesar de que la estructura de la proteína estaba intacta.
Los descubrimientos fueron posibles gracias a la creación del ‘Dominioma Humano 1’, un enorme catálogo de variantes proteicas. El catálogo incluye más de medio millón de mutaciones en 522 dominios de proteínas humanas, los fragmentos de una proteína que determinan su función. Es el mayor catálogo de variantes de dominios de proteínas humanas hasta la fecha.
Los dominios proteicos son regiones específicas que pueden plegarse y crear una estructura estable. Pueden realizar su función independientemente del resto de la proteína. El ‘Dominioma Humano 1’ se creó cambiando sistemáticamente cada aminoácido de estos dominios por todos los demás aminoácidos posibles, creando un catálogo de todas las mutaciones posibles.
El impacto de cada mutación se descubrió introduciendo dominios proteicos mutados en células de levadura. La levadura transformada solo podía producir un tipo de dominio proteico mutado, y los cultivos se llevaron a cabo en tubos de ensayo bajo condiciones que vinculaban la estabilidad de la proteína con el crecimiento de la levadura. Si una proteína mutada era estable, la célula de levadura crecía bien. Si la proteína era inestable, el crecimiento de la levadura era deficiente.
Utilizando una técnica especial, el equipo se aseguró de que solo las células de levadura que producían proteínas estables pudieran sobrevivir y multiplicarse. Al comparar la frecuencia de cada mutación antes y después del crecimiento de la levadura, determinaron qué mutaciones conducían a proteínas estables y cuáles causaban inestabilidad.
Aunque el ‘Dominioma Humano 1’ es aproximadamente 4,5 veces más grande que catálogos anteriores, solo cubre el 2,5% de las proteínas humanas conocidas. A medida que se amplíe el tamaño del catálogo, la contribución exacta de las mutaciones que causan enfermedades a través del mecanismo de inestabilidad proteica será cada vez más clara.
Mientras tanto, se puede utilizar la información de los 522 dominios proteicos para extrapolar a proteínas similares. Esto se debe a que las mutaciones a menudo tienen efectos similares en proteínas que están relacionadas a nivel estructural o funcional. Al analizar un conjunto diverso de dominios proteicos, el equipo descubrió patrones en la forma en que las mutaciones afectan la estabilidad proteica que son consistentes en todas proteínas relacionadas.
"Esencialmente, esto significa que los datos de un dominio proteico pueden ayudar a predecir cómo las mutaciones afectarán a otras proteínas dentro de la misma familia o con estructuras similares. Las 'reglas de juego’ de estos 522 dominios son suficientes para ayudarnos a hacer predicciones informadas sobre muchas más proteínas de las que hay en el catálogo", explica el Dr. Lehner.
El estudio tiene limitaciones. El estudio solo examinó dominios proteicos aislados en lugar de proteínas completas. En organismos vivos, las proteínas interactúan con otras partes de la proteína y con otras moléculas en la célula. Es posible que el estudio no capture completamente cómo las mutaciones afectan a las proteínas en su entorno natural dentro de las células humanas. Los investigadores van a estudiar mutaciones en dominios proteicos más amplios y, finalmente, en proteínas completas.
"En última instancia, queremos mapear los efectos de cada posible mutación en cada proteína humana. Es un esfuerzo ambicioso que puede transformar la medicina de precisión", concluye el Dr. Lehner.
EN CATALÀ
El 'Dominioma Humà' explica la causa de diverses malalties hereditàries
Un catàleg de variants de proteïnes humanes, el més gran creat fins ara, mostra que la desestabilització de les proteïnes és el principal impulsor de les malalties genètiques hereditàries
Les mutacions que substitueixen un aminoàcid per un altre en la seqüència d'una proteïna poden causar malalties. Un estudi publicat avui a la revista Nature explica que això succeeix perquè la majoria d'aquestes mutacions desestabilitzen la proteïna que codifiquen.
Les proteïnes inestables són més propenses a plegar-se incorrectament i degradar-se, cosa que provoca que deixin de funcionar o s'acumulin en quantitats perjudicials dins de les cèl·lules.
L'estudi ajuda a explicar per què canvis mínims en el genoma humà, coneguts com a mutacions amb canvi de sentit, causen malalties a nivell molecular. Demostra que la inestabilitat proteica és un dels principals impulsors de la formació de cataractes hereditàries i també contribueix a diferents tipus de malalties neurològiques, del desenvolupament i musculars.
Un equip científic del Centre de Regulació Genòmica (CRG) a Barcelona i del BGI a Shenzhen va estudiar 621 mutacions amb canvi de sentit conegudes per contribuir a diferents tipus de malaltia. Tres de cada cinc (61%) d'aquestes mutacions van causar una disminució detectable en l'estabilitat de les proteïnes.
L'estudi va examinar més de prop algunes d'aquestes mutacions. Per exemple, les beta-gamma cristal·lines són una família de proteïnes essencials per mantenir la claredat del cristal·lí a l'ull humà. Van descobrir que el 72% (13 de 18) de les mutacions vinculades a la formació de cataractes desestabilitzen les proteïnes cristal·lines, fent que sigui més probable que s'agrupin i formin regions opaques al cristal·lí de l'ull.
L'estudi també va vincular la inestabilitat proteica amb el desenvolupament de la miopatia amb cossos reductors, una afecció rara que causa debilitat i desgast muscular, així com amb la síndrome d'AEC o de Hay-Wells, que es caracteritza per l'existència d'anquiloblèfaron, displàsia ectodèrmica, fissura labiopalatina i altres símptomes del desenvolupament.
No obstant això, l'estudi va descobrir que algunes mutacions causants de malalties no desestabilitzen les proteïnes, fet que posà de manifest l'existència d'altres mecanismes moleculars implicats.
La síndrome de Rett és un trastorn neurològic que causa greus deficiències cognitives i físiques. Està causada per mutacions en el gen MECP2, que produeix una proteïna responsable de regular l'expressió gènica al cervell. L'estudi va trobar que moltes mutacions en MECP2 no desestabilitzen la proteïna, sinó que es troben en regions que afecten la forma en què MECP2 s'uneix a l'ADN per regular altres gens. Aquesta pèrdua de funció podria estar alterant el desenvolupament i funcionament del cervell.
"Revelem, a una escala sense precedents, com les mutacions causen malalties a nivell molecular", diu el Dr. Antoni Beltran, primer autor de l'estudi i investigador al Centre de Regulació Genòmica (CRG) a Barcelona. "En distingir si una mutació desestabilitza una proteïna o altera la seva funció sense afectar l'estabilitat, podem crear estratègies de tractament més precises. Això podria significar la diferència entre desenvolupar fàrmacs que estabilitzin una proteïna versus aquells que inhibeixen una activitat perjudicial. És un pas significatiu cap a la medicina personalitzada".
L'estudi també va trobar que la forma en què les mutacions causen malalties sovint depèn de si la malaltia és recessiva o dominant. Els trastorns genètics dominants es produeixen quan una sola còpia d'un gen mutat és suficient per causar la malaltia, fins i tot si l'altra còpia és normal, mentre que les condicions recessives es produeixen quan un individu hereta dues còpies d'un gen mutat, una de cada progenitor.
Les mutacions que causen trastorns recessius tenen més probabilitats de desestabilitzar les proteïnes, mentre que les mutacions que causen trastorns dominants sovint afecten altres aspectes de la funció proteica, com les interaccions amb l'ADN o altres proteïnes, en lloc de només l'estabilitat.
Per exemple, l'estudi va trobar que una mutació recessiva en CRX, important per a la funció ocular, desestabilitza significativament la proteïna, cosa que podria estar causant distròfies de retina hereditàries perquè la falta d'una proteïna estable i funcional afecta la visió normal. No obstant això, dos tipus diferents de mutacions dominants van fer que la proteïna romangués estable, però funcionés incorrectament de tota manera, causant malalties retinals tot i que l'estructura de la proteïna estava intacta.
Els descobriments van ser possibles gràcies a la creació del 'Dominioma Humà 1', un enorme catàleg de variants proteiques. El catàleg inclou més de mig milió de mutacions en 522 dominis de proteïnes humanes, els fragments d'una proteïna que determinen la seva funció. És el catàleg més gran de variants de dominis de proteïnes humanes fins a la data.
Els dominis proteics són regions específiques que es poden plegar i crear una estructura estable. Poden realitzar la seva funció independentment de la resta de la proteïna. El ‘Dominioma Humà 1’ es va crear canviant sistemàticament cada aminoàcid d'aquests dominis per tots els altres aminoàcids possibles, creant un catàleg de totes les mutacions possibles.
L'impacte de cada mutació es va descobrir introduint dominis proteics mutats en cèl·lules de llevat. El llevat transformat només podia produir un tipus de domini proteic mutat, i els cultius es van dur a terme en tubs d'assaig sota condicions que vinculaven l'estabilitat de la proteïna amb el creixement del llevat. Si una proteïna mutada era estable, la cèl·lula de llevat creixia bé. Si la proteïna era inestable, el creixement del llevat era deficient.
Utilitzant una tècnica especial, l'equip es va assegurar que només les cèl·lules de llevat que produïen proteïnes estables poguessin sobreviure i multiplicar-se. En comparar la freqüència de cada mutació abans i després del creixement del llevat, van determinar quines mutacions conduïen a proteïnes estables i quines causaven inestabilitat.
Tot i que el ‘Dominioma Humà 1’ és aproximadament 4,5 vegades més gran que catàlegs anteriors, només cobreix el 2,5% de les proteïnes humanes conegudes. A mesura que s'ampliï la mida del catàleg, la contribució exacta de les mutacions que causen malalties a través del mecanisme d'inestabilitat proteica serà cada vegada més clara.
Mentrestant, es pot utilitzar la informació dels 522 dominis proteics per extrapolar proteïnes similars. Això succeeix perquè les mutacions sovint tenen efectes similars en proteïnes que estan relacionades a nivell estructural o funcional. En analitzar un conjunt divers de dominis proteics, l'equip va descobrir patrons en la manera en què les mutacions afecten l'estabilitat proteica que són consistents en totes proteïnes relacionades.
"Essencialment, això significa que les dades d'un domini proteic poden ajudar a predir com les mutacions afectaran altres proteïnes dins de la mateixa família o amb estructures similars. Les 'regles de joc' d'aquests 522 dominis són suficients per ajudar-nos a fer prediccions informades sobre moltes més proteïnes de les que hi ha al catàleg", explica el Dr. Lehner.
L'estudi té limitacions. L'estudi només va examinar dominis proteics aïllats en lloc de proteïnes completes. En organismes vius, les proteïnes interactuen amb altres parts de la proteïna i amb altres molècules a la cèl·lula. És possible que l'estudi no capturi completament com les mutacions afecten les proteïnes en el seu entorn natural dins de les cèl·lules humanes. Els investigadors estudiaran mutacions en dominis proteics més amplis i, finalment, en proteïnes completes.
"En última instància, volem cartografiar els efectes de cada possible mutació en cada proteïna humana. És un esforç ambiciós que pot transformar la medicina de precisió", conclou el Dr. Lehner.