NEWS
CRG researchers promote inclusion of local languages in scientific publications
Sílvia Carbonell Sala, Emilio Palumbo, Carme Arnan, Roderic Guigó i Tamara Perteghella. Credit: Centre for Genomic Regulation
The genomes of living beings contain instructions that determine their biological traits. These instructions are primarily concentrated in genes, regions of the human genome which occupy approximately 2% of the entire genome.
Researchers at the Centre for Genomic Regulation (CRG) have developed a method to more accurately identify and characterise these genes. The method works by analysing RNA sequences (called transcripts), the molecules which execute the instructions of genes.
Until recently, methods for determining RNA sequences had significant limitations, primarily because researchers could not obtain sequences as long as the genes themselves. However, recent advances in sequencing technologies now allow for the acquisition of much longer sequences.
A group led by Dr. Roderic Guigó and Dr. Silvia Carbonell Sala at the Centre for Genomic Regulation has leveraged these new methodologies to develop a method that enables the complete sequencing of RNA molecules. The findings are published today in the journal Nature Communications.
“Among other applications, we are using this method within GENCODE, the international consortium which aims to identify and characterise all genes in the human and mouse genomes. The catalogues of all genes can help accelerate important discoveries in biology that improve our understanding of human health and disease,” explains Dr. Carbonell, researcher at the CRG and main author of the study.
The researchers also translated the scientific abstract of the study, a short summary of the research which is usually written in the first pages of a scientific publication, in Catalan. The study in Nature Communications directly links to the Catalan version of the abstract, as well as a layman’s abstract which summarises the research in simple terms for a non-specialist audience.
“To the best of our knowledge, this is the first time a major international publisher has agreed to explicitly reference a translation of a scientific study in Catalan. In this case, we did it so that citizens directly funding our research can access it. We hope that this sets a precedent, and the same model is adopted by other scientists all around the world to make results of research more accessible to non-English-speaking individuals” explains Dr. Guigó, Group Leader at the Centre for Genomic Regulation.
One of the main drivers of translating the scientific abstract from English into Catalan is to preserve and promote linguistic diversity. According to the authors of the study, while English brings many benefits in promoting the exchange of ideas around the world, it can monopolise scientific terminology, causing ‘linguistic poverty’ in the creation of scientific terms and expressions in other languages.
“We discovered that words we use in the scientific realm all the time, for example long-read RNA sequencing, do not have an equivalent in Catalan. Generating scientific terminology is essential to maintain the vitality of languages and maintain them fully functional” says Dr. Guigó.
“There are around nine million Catalan speakers in the world, four of which speak the language natively. By creating these translations, we can create new scientific terms and expressions in our language that helps our citizens to better understand the output of scientific research. It’s an exercise in enhancing overall scientific literacy,” adds Dr. Guigó.
The study’s translation is hosted on the Zenodo platform, a repository for EU-funded research that has its own DOI link, making the translated versions citable. The Centre for Genomic Regulation will continue to trial the use of this platform and explore how to implement language translation in its scientific publication policy.
“Diverse linguistic representation in science promotes a more global perspective, acknowledging that valuable scientific insights and contributions can come from all parts of the world, irrespective of the dominant language,” says Joan Vives, Managing Director of the Centre for Genomic Regulation and coordinator of the institution’s language policy. “By translating scientific studies, we help level the playing field, ensuring that all communities have equal access to valuable knowledge and resources,” he adds.
EN CATALÀ
El CRG promou la inclusió de llengües locals en publicacions científiques
Els genomes dels éssers vius contenen instruccions que determinen els seus trets biològics. Aquestes instruccions es concentren principalment en els gens, regions del genoma humà que ocupen aproximadament el 2% de tot el genoma.
Un equip científic del Centre de Regulació Genòmica (CRG) ha desenvolupat un mètode per identificar i caracteritzar amb més precisió aquests gens. El mètode funciona analitzant seqüències d'ARN (transcripcions), les molècules que executen les instruccions dels gens.
Fins fa poc, els mètodes per determinar seqüències d'ARN tenien limitacions importants, principalment perquè no es podia obtenir seqüències tan llargues com els mateixos gens. No obstant això, els recents avenços en les tecnologies de seqüenciació permeten ara l'obtenció de seqüències molt més llargues.
Un grup liderat pel Dr. Roderic Guigó i la Dra. Sílvia Carbonell Sala, del Centre de Regulació Genòmica, ha aprofitat aquestes noves metodologies per desenvolupar un mètode que permeti la seqüenciació completa de molècules d’ARN. Les troballes es publiquen avui a la revista Nature Communications.
"Entre d’altres aplicacions, estem utilitzant aquest mètode dins de GENCODE, el consorci internacional que té com a objectiu identificar i caracteritzar tots els gens en els genomes humans i de ratolí. Els catàlegs de tots els gens poden ajudar a accelerar importants descobriments en biologia que millorin la nostra comprensió de la salut i la malaltia humana", explica la Dra. Carbonell Sala, investigadora del CRG i autora principal de l’estudi.
Per primera vegada, els autors i les autores de l'article han redactat el resum de l'estudi, un breu paràgraf que sol estar escrit a les primeres pàgines d'una publicació científica, en català. L'estudi de Nature Communications enllaça directament amb la versió catalana del resum, així com amb un resum de la recerca en termes simples per a un públic no especialitzat.
"Fins on sabem, aquesta és la primera vegada que una important editorial internacional accepta fer referència explícita a una traducció d'un estudi científic en català. En aquest cas, ho fem perquè les ciutadanes i els ciutadans que financen directament la nostra investigació hi puguin accedir. Esperem que això assenti un precedent i que altres científics de tot el món adoptin el mateix model per fer que els resultats de la recerca siguin més accessibles a les persones que no parlen anglès", explica el Dr. Guigó, cap de grup del Centre de Regulació Genòmica.
Un dels principals motius per traduir el resum científic de l'anglès al català és preservar i promoure la diversitat lingüística. Segons els autors de l'estudi, si bé l'anglès aporta molts beneficis a l'hora de promoure l'intercanvi d'idees arreu del món, pot monopolitzar la terminologia científica, provocant "pobresa lingüística" en la creació de termes i expressions científiques en d’altres llengües.
"Descobrim que paraules que utilitzem constantment en l'àmbit científic, com per exemple, seqüenciació d'ARN de lectura llarga, no tenen equivalent en català. Generar terminologia científica és fonamental per mantenir la vitalitat de les llengües i mantenir-les en ple funcionament", afirma el Dr. Guigó.
"Hi ha al voltant de nou milions de catalanoparlants al món, quatre dels quals el parlen de forma nativa. En crear aquestes traduccions, podem crear nous termes i expressions científiques en el nostre idioma que ajudin la nostra ciutadania a comprendre millor els resultats de la recerca científica. És un exercici per millorar l'alfabetització científica general", afegeix el Dr. Guigó.
La traducció de l'estudi està allotjada a la plataforma Zenodo, un repositori d'investigacions finançades per la UE que té el seu propi enllaç DOI, cosa que fa que les versions traduïdes es puguin citar. El Centre de Regulació Genòmica continuarà provant l'ús d'aquesta plataforma i explorarà com implementar la traducció d'idiomes en la seva política de publicacions científiques.
"La representació lingüística diversa en la ciència promou una perspectiva més global, reconeixent que els coneixements i les contribucions científiques valuoses poden provenir d'arreu del món, independentment de la llengua dominant", afirma Joan Vives, gerent del Centre de Regulació Genòmica i coordinador de la política lingüística de l'institut. "En traduir els estudis científics, ajudem a anivellar el camp de joc, assegurant que totes les comunitats tinguin igual accés a coneixements i recursos valuosos", afegeix.
EN CASTELLANO
El CRG promueve la inclusión de lenguas locales en publicaciones científicas
Un equipo científico del Centro de Regulación Genómica publica hoy en la revista Nature Communications un nuevo método para identificar y caracterizar genes. El estudio enlaza explícitamente con una traducción del resumen científico al catalán como parte de una iniciativa del CRG para hacer que la investigación sea más accesible en los idiomas locales.
Los genomas de los seres vivos contienen instrucciones que determinan sus rasgos biológicos. Estas instrucciones se concentran principalmente en los genes, regiones del genoma humano que ocupan aproximadamente el 2% de todo el genoma.
Un equipo científico del Centro de Regulación Genómica (CRG) ha desarrollado un método para identificar y caracterizar con mayor precisión estos genes. El método funciona analizando secuencias de ARN (transcripciones), las moléculas que ejecutan las instrucciones de los genes.
Hasta hace poco, los métodos para determinar secuencias de ARN tenían limitaciones importantes, principalmente porque no se podía obtener secuencias tan largas como los propios genes. Sin embargo, los recientes avances en las tecnologías de secuenciación permiten ahora la obtención de secuencias mucho más largas.
Un grupo liderado por el Dr. Roderic Guigó y la Dra. Silvia Carbonell Sala del Centro de Regulación Genómica ha aprovechado estas nuevas metodologías para desarrollar un método que permita la secuenciación completa de moléculas de ARN. Los hallazgos se publican hoy en la revista Nature Communications.
“Entre otras aplicaciones, estamos utilizando este método dentro de GENCODE, el consorcio internacional que tiene como objetivo identificar y caracterizar todos los genes en los genomas humanos y de ratón. Los catálogos de todos los genes pueden ayudar a acelerar importantes descubrimientos en biología que mejoren nuestra comprensión de la salud y la enfermedad humana”, explica la Dra. Carbonell Sala, investigadora del CRG y autora principal del estudio.
Por primera vez, los autores y las autoras del artículo han redactado el resumen del estudio, un breve párrafo que suele estar escrito en las primeras páginas de una publicación científica, en catalán. El estudio de Nature Communications enlaza directamente con la versión catalana del resumen, así como con un resumen de la investigación en términos simples para un público no especializado.
“Hasta donde sabemos, esta es la primera vez que una importante editorial internacional acepta hacer referencia explícita a una traducción de un estudio científico en catalán. En este caso, lo hicimos para que los ciudadanos y las ciudadanas que financian directamente nuestra investigación puedan acceder a ella. Esperamos que esto siente un precedente y que otros científicos de todo el mundo adopten el mismo modelo para hacer que los resultados de la investigación sean más accesibles a las personas que no hablan inglés”, explica el Dr. Guigó, jefe de grupo del Centro de Regulación Genómica.
Uno de los principales motivos para traducir el resumen científico del inglés al catalán es preservar y promover la diversidad lingüística. Según los autores del estudio, si bien el inglés aporta muchos beneficios a la hora de promover el intercambio de ideas en todo el mundo, puede monopolizar la terminología científica, provocando “pobreza lingüística” en la creación de términos y expresiones científicas en otras lenguas.
“Descubrimos que palabras que utilizamos constantemente en el ámbito científico, como por ejemplo, secuenciación de ARN de lectura larga, no tienen equivalente en catalán. Generar terminología científica es fundamental para mantener la vitalidad de las lenguas y mantenerlas en pleno funcionamiento”, afirma el Dr. Guigó.
“Hay alrededor de nueve millones de catalanoparlantes en el mundo, cuatro de los cuales lo hablan de forma nativa. Al crear estas traducciones, podemos crear nuevos términos y expresiones científicas en nuestro idioma que ayuden a nuestra ciudadanía a comprender mejor los resultados de la investigación científica. Es un ejercicio para mejorar la alfabetización científica general”, añade el Dr. Guigó.
La traducción del estudio está alojada en la plataforma Zenodo, un repositorio de investigaciones financiadas por la UE que tiene su propio enlace DOI, lo que hace que las versiones traducidas sean citables. El Centro de Regulación Genómica continuará probando el uso de esta plataforma y explorará cómo implementar la traducción de idiomas en su política de publicaciones científicas.
"La representación lingüística diversa en la ciencia promueve una perspectiva más global, reconociendo que los conocimientos y las contribuciones científicas valiosas pueden provenir de todas partes del mundo, independientemente de la lengua dominante", afirma Joan Vives, gerente del Centro de Regulación Genómica y coordinador de la política lingüística del instituto. “Al traducir los estudios científicos, ayudamos a nivelar el campo de juego, asegurando que todas las comunidades tengan igual acceso a conocimientos y recursos valiosos”, añade.