Direct RNA sequencing made applicable to patient-derived samples
Direct RNA sequencing made applicable to patient-derived samples
Researchers have developed a method to detect diverse RNA molecules, such as viral RNAs, in samples with minimal biological material. Taking advantage of existing sequencing methods, CRG’s scientists carried out an algorithm to identify and classify, with high accuracy, RNA molecules from multiple samples sequenced together. This method can enable the real-time detection of viral RNA sequences from patient-derived samples, laying out a good alternative to analyse the presence of the new coronavirus.
The method is based on nanopore sequencing, a technique that provides scientists and clinicians with immediate access to the native DNA and RNA sequences within a living cell, without requiring any conversion. While traditional sequencing tools can take hours or days to provide results, nanopore sequencing provides information in real time.
Schematic overview of the direct RNA barcoding and demultiplexing strategy (Credits: Dr. Eva Novoa’s laboratory - Centre for Genomic Regulation)
However, nanopore RNA sequencing has limited use for medical purposes because it requires a large amount of biological material present in samples to carry out its analysis. Overcoming these limitations can significantly open up the benefits of this nascent technology.
In a study published today in the journal Genome Research, researchers from the Centre for Genomic Regulation (CRG) describe a new experimental and computational method that can add barcodes to direct RNA sequencing data with 99% accuracy, and obtain high quality libraries even when the sample has limited biological material. By pooling and sequencing many different samples together, researchers can decrease the input material required opening, for the first time, the possibility of applying this powerful technology to patient-derived samples.
The new method uses computational algorithms based on deep learning allowing, for the first time, to analyse multiple RNA samples simultaneously using nanopore sequencing and improves the cost-effectiveness of the technology.
“Direct RNA sequencing provides complex and unbiased information such as the viruses present in a sample, their proportion or the mutations present in each virus. A much richer information than the simple presence/absence of a specific virus provided by a PCR”, says Eva Novoa, group leader at the CRG and lead author of the new paper. “However, the lack of barcoding and combining multiple unrelated samples has limited our ability to apply this technology to biological samples in which the input amount is limiting. The availability of barcoding and algorithms to identify each sample will allow the community to apply this technology to a much wider range of biological samples, including patient-derived samples.”
Eva Novoa’s team has previously aided international research efforts around COVID-19 by launching a publicly-available, free-to-use resource (https://covid.crg.eu) that standardizes the analysis of publicly available SARS-CoV-2 nanopore sequencing data.
Reference: Smith M, Ersavas T, Ferguson J, Liu H, Lucas M, Begilk O, Bojarski L, Barton K, Novoa, E. 2020. "Molecular barcoding of native RNAs using nanopore sequencing and deep learning". Genome Research, doi: https://doi.org/10.1101/gr.260836.120
Funding acknowledgements: MCL is supported by the CRG International PhD Fellowships Programme. EMN was supported by a DECRA fellowship from the Australian Research Council (DE170100506) and is currently supported by CRG Severo Ochoa Funding. This work was funded by the Australian Research Council (DP180103571). We acknowledge the support of the Spanish Ministry of Economy, Industry and Competitiveness (MEIC) to the EMBL partnership, Centro de Excelencia Severo Ochoa and CERCA Programme / Generalitat de Catalunya.
La secuenciación directa de ARN ya es posible en muestras derivadas de pacientes
Los investigadores han desarrollado un método para detectar distintas moléculas de ARN, como el ARN viral, en muestras con poco material biológico disponible. Aprovechando las técnicas de secuenciación ya existentes, un equipo científico del CRG ha desarrollado un algoritmo para identificar y clasificar, con gran precisión, las moléculas de ARN de múltiples muestras secuenciadas a la vez. Este método permite detectar en tiempo real secuencias de ARN viral de muestras de pacientes, proporcionando una buena alternativa para analizar la presencia del nuevo coronavirus.
El método se basa en la secuenciación por nanoporos, una técnica que permite que médicos y científicos tengan acceso directo a las moléculas de ADN y ARN nativas de células vivas sin requerir ninguna conversión. Mientras que las herramientas de secuenciación tradicionales pueden tardar horas o días en tener los resultados, la secuenciación por nanoporos da la información en tiempo real.
Sin embargo, el uso de la secuenciación de ARN por nanoporos con fines médicos se ve limitado por el hecho que para realizar los análisis se requiere de una gran cantidad de material biológico. Superar estas limitaciones puede mejorar significativamente los beneficios de esta tecnología emergente.
En un estudio publicado hoy en la revista Genome Research, un equipo científico del Centro de Regulación Genómica (CRG) describe un nuevo método experimental y computacional para añadir códigos de barras a los datos de la secuenciación directa de ARN con una exactitud del 99%, y así obtener librerías de gran calidad incluso de muestras con poco material biológico. Así, agrupando y secuenciando varias muestras a la vez, los investigadores pueden disminuir la cantidad de material necesaria para empezar el análisis, abriendo, por primera vez, la posibilidad de aplicar esta poderosa tecnología a muestras derivadas de pacientes.
El nuevo método usa algoritmos computacionales basados en el aprendizaje profundo permitiendo, por primera vez, analizar múltiples muestras de ARN simultáneamente usando la secuenciación por nanoporos, mejorando la rentabilidad de la tecnología.
“La secuenciación directa de ARN proporciona información compleja y sin sesgos, como qué virus están presentes en la muestra, su proporción o las mutaciones que presentan cada uno de ellos. Una información más rica que la simple presencia o ausencia de un virus específico que nos proporciona la PCR”, dice Eva Novoa, jefa de grupo en el CRG y autora principal del artículo. “Sin embargo, la falta de identificación y posibilidad de combinar múltiples muestras no relacionadas ha limitado nuestra habilidad de aplicar esta tecnología en muestras biológicas, donde, la cantidad de material disponible acostumbra a ser pequeña. Disponer de los códigos de barras y algoritmos para identificar y clasificar cada muestra permitirá a la comunidad aplicar esta tecnología a un rango mayor de muestras biológicas, incluyendo aquellas que derivan de pacientes”.
El equipo de Eva Novoa ha contribuido a la investigación internacional relacionada con la COVID-19 lanzando un recurso público y de libre uso que estandariza el análisis de los datos del SARS-Cov-2 secuenciadas por nanoporos (https://covid.crg.eu).
Referencia: Smith M, Ersavas T, Ferguson J, Liu H, Lucas M, Begilk O, Bojarski L, Barton K, Novoa, E. 2020. "Molecular barcoding of native RNAs using nanopore sequencing and deep learning". Genome Research, doi: https://doi.org/10.1101/gr.260836.120
Financiación: MCL recibe el apoyo del CRG International PhD Fellowships Programme. EMN recibió el apoyo de una beca DECRA del Australian Research Council (DE170100506) y actualmente cuenta con el apoyo de la ayuda Severo Ochoa del CRG. Este estudio ha sido financiado por el Australian Research Council (DP180103571). Reconocemos el apoyo del Ministerio de Economía, Industria y Competitividad (MEIC) al partnership del EMBL, Centro de Excelencia Severo Ochoa y Programa CERCA / Generalitat de Catalunya.
La seqüenciació directa d’ARN ja és possible en mostres derivades de pacients
Els investigadors han desenvolupat un mètode per a detectar diferents molècules d’ARN, com l’ARN viral, en mostres amb poc material biològic disponible. Aprofitant les tècniques de seqüenciació ja existents, un equip científic del CRG ha desenvolupat un algoritme per a identificar i classificar, amb gran precisió, les molècules d’ARN de múltiples mostres seqüenciades alhora. Aquest mètode permet detectar en temps real seqüències d’ARN viral en mostres de pacients, proporcionant una bona alternativa per a analitzar la presència del nou coronavirus.
El mètode es basa en la seqüenciació per nanopors, una tècnica que permet que metges i científics tinguin accés directe a les molècules d’ADN i ARN natives de les cèl·lules vives sense necessitat de fer cap conversió. Mentre que les eines de seqüenciació tradicionals poden trigar hores o dies en tenir els resultats, la seqüenciació per nanopors dóna la informació en temps real.
Malgrat tot, l’ús de la seqüenciació d’ARN per nanopors amb finalitats mèdiques es veu limitada pel fet que per fer les anàlisi es requereix una gran quantitat de material biològic. Superar aquestes limitacions pot millorar, significativament, els beneficis d’aquesta tecnologia emergent.
En un estudi publicat avui a la revista Genome Research, un equip científic del Centre de Regulació Genòmica (CRG) descriu un nou mètode experimental i computacional per a afegir codis de barres a les dades resultants de la seqüenciació directa de l’ARN amb una exactitud del 99%, per tal d’obtenir llibreries de gran qualitat fins i tot quan provenen de mostres amb poc material biològic disponible. Així, agrupant i seqüenciant diferents mostres a la vegada, els investigadors poden disminuir la quantitat de material necessari disponible per fer les anàlisis, obrint, per primer cop, la possibilitat d’aplicar aquesta tecnologia poderosa a mostres derivades de pacients.
El nou mètode utilitza algoritmes computacionals basats en l’aprenentatge profund permetent, per primera vegada, analitzar múltiples mostres d’ARN simultàniament mitjançant la seqüenciació per nanopors, millorant la rendibilitat de la tecnologia.
“La seqüenciació directa d’ARN proporciona informació complexa i sense biaixos, com ara quin virus trobem a la mostra, la seva proporció o quines mutacions presenten cadascun d’ells. Una informació més rica que la simple presència o absència d’un virus concret que ens proporciona la PCR”, diu l’Eva Novoa, cap de grup del CRG i autora principal de l’article. “Malgrat tot, la falta d’identificació i la possibilitat de combinar diverses mostres no relacionades ha limitat la nostra habilitat d’aplicar aquesta tecnologia a mostres biològiques, on la quantitat de material disponible, sovint és petita. Disposar de codis de barres i algoritmes per a identificar i classificar cada mostra permetrà a la comunitat aplicar aquesta tecnologia a una gran varietat de mostres biològiques, incloent aquelles que deriven de pacients”.
L’equip de l’Eva Novoa ja ha contribuït a la investigació internacional relacionada amb la COVID-19 llançant un recurs públic i d’ús lliure que estandarditza l’anàlisi de les dades del SARS-Cov-2 seqüenciades per nanopors (https://covid.crg.eu).
Referència: Smith M, Ersavas T, Ferguson J, Liu H, Lucas M, Begilk O, Bojarski L, Barton K, Novoa, E. 2020. "Molecular barcoding of native RNAs using nanopore sequencing and deep learning". Genome Research, doi: https://doi.org/10.1101/gr.260836.120
Finançament: MCL rep el suport del CRG International PhD Fellowships Programme. EMN va rebre el suport d'una beca DECRA de l'Australian Research Council (DE170100506) i actualment compta amb el suport de l'ajut Severo Ochoa del CRG. Aquest estudi ha estat finançat per l'Australian Research Council (DP180103571). Reconeixem el suport del Ministerio de Economía, Industria y Competitividad (MEIC) al partnership de l'EMBL, Centro de Excelencia Severo Ochoa i Programa CERCA / Generalitat de Catalunya.