Detection of 16S ribosomal RNA in clinical samples
Virolainen, Iida (2022)
Virolainen, Iida
2022
Master's Programme in Biomedical Technology
Lääketieteen ja terveysteknologian tiedekunta - Faculty of Medicine and Health Technology
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Hyväksymispäivämäärä
2022-05-18
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:tuni-202204223435
https://urn.fi/URN:NBN:fi:tuni-202204223435
Tiivistelmä
Molecular methods can be utilized to detect and identify pathogens that are difficult to culture or even nonculturable. Polymerase chain reaction (PCR) is the most advantaged of the possible molecular methods to recognize pathogens, like bacteria, based on their nucleic acids, RNA and DNA. To detect bacteria in the samples, PCR circumstances can be designed for a certain gene variant, species specific, more multiple species/genera or all possible bacterial taxa. PCR techniques also play an important role in targeted next generation sequencing (NGS), which has gained increasing attention by giving desired, modern tools to the field of clinical microbiology. With these constantly developing NGS tools, bacterial RNA signals interacting and manipulating cellular, molecular, and genetic networks of human can be identified and studied with constantly growing sensitivity. NGS technology also offers exciting new research directions in studies of bacterial pathogenesis in several diseases with currently unknown etiology. To make significant findings in the field of clinical microbiology with these exciting novel tools, practical and effortless protocol for pre-processing of samples for NGS is a necessity.
The main objective of this Thesis was to construct and optimize a protocol for pre-processing of clinical samples for NGS and eventually, identify from which bacteria the isolated RNA is from with 16S rRNA sequencing conducted with Illumina MiSeq. Bacterial RNA was extracted from saliva and plasma of four (n = 4) healthy volunteers. The amount and quality of isolated RNA was determined and later converted to cDNA. To ensure sufficient concentration and quality of converted cDNA, cDNA was checked with ssDNA Qubit, Nanodrop and droplet digital PCR. 16S library preparation was conducted with Swift Normalase® Amplicon Panels (SNAP) kit. After 1st PCR (Multiplex PCR), 2nd PCR (Indexing PCR), Normalizing, and clean-up phases according to pre-processing SNAP workflow, quality of the sample preparations was checked with Fragment Analyzer and concentration measured with dsDNA Qubit. Final libraries were denaturated according to instructions from Illumina, and after denaturation, the samples were loaded to MiSeq 16S sequencer and run was started.
As a result of this Thesis, the novel protocol for isolation of bacterial RNA for saliva and plasma samples was successfully constructed and optimized. The finding of bacterial RNA in plasma from healthy volunteers can be considered as a relatively novel discovery. Additionally, this study managed to measure concentration of bacterial RNA and cDNA in clinical samples based on different quantification methods. Before entering to sequencing, DNA concentration in raw library pool and 1/10 dilution consisting of saliva and plasma samples were 6.07 ng/μl and 0.270 ng/μl, respectively. However, the attempt to identify from which bacterium isolated RNA in clinical samples was from with 16S rRNA sequencing ended up with error. This error probably occurred due the incompatible pre-processing with a kit from 3rd party or imprecise measured concentration of DNA in the library pool before sequencing.
Due to breakthroughs in NGS technology and the constantly reducing costs of sequencing, 16S rRNA sequencing is now one of the most advantaged strategies in recognition of pathogens in clinical samples. However, the lack of professional bioinformatics analysts in many research units, and the uncertainties in sample preparation have limited the extensive 16S rRNA sequencing usage in clinical settings. However, despite the currently existing challenges, many noteworthy technical and biological questions of messages delivered to human cells by bacterial RNA are constantly closer to get answers in the upcoming years. Molekulaarisia metodeja voidaan hyödyntää havaitsemaan ja tunnistamaan bakteereita, joiden viljely on haastavaa tai jopa mahdotonta. Nukleiinihappojen eli DNA:n ja RNA:n monistamiseen perustuva polymeraasiketjureaktio (PCR) on hyödynnetyin patogeenien kuten bakteerien tunnistamiseen käytetty molekulaarinen tunnistusmetodi. Jotta on mahdollista tunnistaa bakteereja erilaisissa näytteissä monistamalla niiden genomin osia, PCR olosuhteet täytyy suunnitella spesifeiksi monistettavan alueen mukaisesti. Erilaisilla PCR tekniikoilla on myös tärkeä rooli uuden sukupolven sekvensoinnissa (NGS), joka on tarjonnut uusia toivottuja työkaluja kliinisen mikrobiologian tutkimuskentälle. Nämä jatkuvasti kehittyvät erittäin tarkat sekvensointitekniikat mahdollistavat uudenlaiset tutkimuskohteet, kuten tutkimukset bakteeriperäisen RNA:n vuorovaikutuksesta ihmissolujen ja -molekyylien kanssa. Uuden sukupolven sekvensointi tarjoaa lisäksi uudenlaisia tutkimussuuntia bakteerien patogeneesistä useiden tällä hetkeltä etiologialtaan tuntemattomien sairauksien taustalla. Jotta uusia teknologioita voidaan hyödyntää parhaalla mahdollisella tavalla kliinisen mikrobiologian tutkimuksissa, toimiva ja vaivaton protokolla näytteiden esikäsittelyyn on välttämättömyys.
Tämän opinnäytetyön (Pro gradu) tavoitteena oli laatia ja optimoida esikäsittelyprotokolla kliinisille näytteille uuden sukupolven sekvensointia varten ja lopulta selvittää 16S ribosomaalisen RNA:n (rRNA) sekvensoinnilla (Illumina MiSeq) mistä bakteereista eristämämme RNA on peräisin. Aluksi bakteeriperäinen RNA eristettiin neljältä (n = 4) terveeltä vapaaehtoiselta sekä syljestä että plasmasta. Eristetyn RNA:n määrä ja laatu mitattiin ja RNA käännettiin cDNA:ksi. Tämän käännetyn cDNA:n määrä ja laatu tarkistettiin riittävän saannon varmistamiseksi ssDNA Qubit -, Nanodrop- ja droplet digital PCR-menetelmillä. 16S sekvensointiin valmistava esikäsittely suoritettiin kaupallisella Swift Normalase® Amplicon Panels (SNAP) -kitillä. SNAP-kitillä tehtyjen ensimmäisen (multiplex-PCR) ja toisen (indeksointi-PCR) PCR:n, normalisoinnin, ja puhdistusvaiheiden jälkeen näytepreparaateissa olevan DNA:n laatu tarkistettiin Fragment Analyzerilla ja konsentraatio mitattiin dsDNA Qubitilla. Lopulliset SNAP-protokollan läpikäyneet preparaatit denaturoitiin, näytteet ladattiin sekvensointilaitteeseen ja sekvensointiajo aloitettiin.
Tässä opinnäytetyössä onnistuttiin laatimaan ja optimoimaan uusi protokolla bakteeriperäisen RNA:n eristykseen sylki- ja plasmanäytteistä. Bakteeriperäisen RNA:n todentaminen terveiden vapaaehtoisten plasmasta on suhteellisen tuore löydös. Lisäksi tässä tutkimuksessa onnistuttiin mittaamaan bakteeriperäisen RNA:n ja cDNA:n määrä kliinisissä näytteissä erilaisia kvantifiointimetodeja hyödyntäen. Ennen sekvensoinnin aloittamista, DNA konsentraatio sylki- ja plasmanäytteistä yhdistetyssä kirjastopoolissa ja sen 1/10 laimennoksessa olivat 6,07 ng/μl ja 0,270 ng/μl. Valitettavasti yritys tunnistaa syljessä ja plasmassa olevat bakteerilajit epäonnistui 16S rRNA:n sekvensointiajon päättyessä ennenaikaisesti. Sekvensointiajon ennenaikainen päättyminen johtui todennäköisesti 16S sekvensointilaitteen kanssa yhteensopimattomasta esivalmistelusta (Swift vs Illumina), tai epätarkasta mitatusta DNA konsentraatiosta kirjastopoolissa.
Uuden sukupolven sekvensointitekniikassa saavutetut edistysaskeleet ja jatkuvasti madaltuvat sekvensoinnin kustannukset mahdollistavat 16S rRNA sekvensoinnin monipuolisen hyödyntämisen yhä enemmissä määrin kliinisissä näytteissä olevien patogeenien tunnistuksessa. Kuitenkin vielä tällä hetkellä bioinformaatikoiden puuttuminen useimmista laboratorioista sekä näytteiden esikäsittelyyn liittyvät epävarmuudet rajoittavat menetelmän potentiaalia kliinisissä tutkimusasetelmissa. Nykyisistä haasteista huolimatta, monet tekniset ja biologiset kysymykset bakteeriperäisen RNA:n ja humaanisolujen vuorovaikutuksesta ovat etenevissä määrin lähempänä saada vastauksia jo lähivuosina.
The main objective of this Thesis was to construct and optimize a protocol for pre-processing of clinical samples for NGS and eventually, identify from which bacteria the isolated RNA is from with 16S rRNA sequencing conducted with Illumina MiSeq. Bacterial RNA was extracted from saliva and plasma of four (n = 4) healthy volunteers. The amount and quality of isolated RNA was determined and later converted to cDNA. To ensure sufficient concentration and quality of converted cDNA, cDNA was checked with ssDNA Qubit, Nanodrop and droplet digital PCR. 16S library preparation was conducted with Swift Normalase® Amplicon Panels (SNAP) kit. After 1st PCR (Multiplex PCR), 2nd PCR (Indexing PCR), Normalizing, and clean-up phases according to pre-processing SNAP workflow, quality of the sample preparations was checked with Fragment Analyzer and concentration measured with dsDNA Qubit. Final libraries were denaturated according to instructions from Illumina, and after denaturation, the samples were loaded to MiSeq 16S sequencer and run was started.
As a result of this Thesis, the novel protocol for isolation of bacterial RNA for saliva and plasma samples was successfully constructed and optimized. The finding of bacterial RNA in plasma from healthy volunteers can be considered as a relatively novel discovery. Additionally, this study managed to measure concentration of bacterial RNA and cDNA in clinical samples based on different quantification methods. Before entering to sequencing, DNA concentration in raw library pool and 1/10 dilution consisting of saliva and plasma samples were 6.07 ng/μl and 0.270 ng/μl, respectively. However, the attempt to identify from which bacterium isolated RNA in clinical samples was from with 16S rRNA sequencing ended up with error. This error probably occurred due the incompatible pre-processing with a kit from 3rd party or imprecise measured concentration of DNA in the library pool before sequencing.
Due to breakthroughs in NGS technology and the constantly reducing costs of sequencing, 16S rRNA sequencing is now one of the most advantaged strategies in recognition of pathogens in clinical samples. However, the lack of professional bioinformatics analysts in many research units, and the uncertainties in sample preparation have limited the extensive 16S rRNA sequencing usage in clinical settings. However, despite the currently existing challenges, many noteworthy technical and biological questions of messages delivered to human cells by bacterial RNA are constantly closer to get answers in the upcoming years.
Tämän opinnäytetyön (Pro gradu) tavoitteena oli laatia ja optimoida esikäsittelyprotokolla kliinisille näytteille uuden sukupolven sekvensointia varten ja lopulta selvittää 16S ribosomaalisen RNA:n (rRNA) sekvensoinnilla (Illumina MiSeq) mistä bakteereista eristämämme RNA on peräisin. Aluksi bakteeriperäinen RNA eristettiin neljältä (n = 4) terveeltä vapaaehtoiselta sekä syljestä että plasmasta. Eristetyn RNA:n määrä ja laatu mitattiin ja RNA käännettiin cDNA:ksi. Tämän käännetyn cDNA:n määrä ja laatu tarkistettiin riittävän saannon varmistamiseksi ssDNA Qubit -, Nanodrop- ja droplet digital PCR-menetelmillä. 16S sekvensointiin valmistava esikäsittely suoritettiin kaupallisella Swift Normalase® Amplicon Panels (SNAP) -kitillä. SNAP-kitillä tehtyjen ensimmäisen (multiplex-PCR) ja toisen (indeksointi-PCR) PCR:n, normalisoinnin, ja puhdistusvaiheiden jälkeen näytepreparaateissa olevan DNA:n laatu tarkistettiin Fragment Analyzerilla ja konsentraatio mitattiin dsDNA Qubitilla. Lopulliset SNAP-protokollan läpikäyneet preparaatit denaturoitiin, näytteet ladattiin sekvensointilaitteeseen ja sekvensointiajo aloitettiin.
Tässä opinnäytetyössä onnistuttiin laatimaan ja optimoimaan uusi protokolla bakteeriperäisen RNA:n eristykseen sylki- ja plasmanäytteistä. Bakteeriperäisen RNA:n todentaminen terveiden vapaaehtoisten plasmasta on suhteellisen tuore löydös. Lisäksi tässä tutkimuksessa onnistuttiin mittaamaan bakteeriperäisen RNA:n ja cDNA:n määrä kliinisissä näytteissä erilaisia kvantifiointimetodeja hyödyntäen. Ennen sekvensoinnin aloittamista, DNA konsentraatio sylki- ja plasmanäytteistä yhdistetyssä kirjastopoolissa ja sen 1/10 laimennoksessa olivat 6,07 ng/μl ja 0,270 ng/μl. Valitettavasti yritys tunnistaa syljessä ja plasmassa olevat bakteerilajit epäonnistui 16S rRNA:n sekvensointiajon päättyessä ennenaikaisesti. Sekvensointiajon ennenaikainen päättyminen johtui todennäköisesti 16S sekvensointilaitteen kanssa yhteensopimattomasta esivalmistelusta (Swift vs Illumina), tai epätarkasta mitatusta DNA konsentraatiosta kirjastopoolissa.
Uuden sukupolven sekvensointitekniikassa saavutetut edistysaskeleet ja jatkuvasti madaltuvat sekvensoinnin kustannukset mahdollistavat 16S rRNA sekvensoinnin monipuolisen hyödyntämisen yhä enemmissä määrin kliinisissä näytteissä olevien patogeenien tunnistuksessa. Kuitenkin vielä tällä hetkellä bioinformaatikoiden puuttuminen useimmista laboratorioista sekä näytteiden esikäsittelyyn liittyvät epävarmuudet rajoittavat menetelmän potentiaalia kliinisissä tutkimusasetelmissa. Nykyisistä haasteista huolimatta, monet tekniset ja biologiset kysymykset bakteeriperäisen RNA:n ja humaanisolujen vuorovaikutuksesta ovat etenevissä määrin lähempänä saada vastauksia jo lähivuosina.