Analysis of Chromatin and Proteins in Cancer
Tabaro, Francesco (2020)
Tabaro, Francesco
Tampere University
2020
Lääketieteen ja biotieteiden tohtoriohjelma - Doctoral Programme in Medicine and Life Sciences
Lääketieteen ja terveysteknologian tiedekunta - Faculty of Medicine and Health Technology
This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
Väitöspäivä
2020-11-27
Julkaisun pysyvä osoite on
https://urn.fi/URN:ISBN:978-952-03-1795-9
https://urn.fi/URN:ISBN:978-952-03-1795-9
Tiivistelmä
Geenien ilmentyminen on vahvasti säädelty biologinen prosessi. Proksimaalisten ja distaalisten säätelyalueiden yhteistyö mahdollistaa transkriptiokoneiston tarkan kohdentamisen geenin promoottoriin ja siten transkriptioaktiivisuuden säätelyn. Transkriptiotekijät sitoutuvat geenien säätelyalueille, joiden saavutettavuutta säädellään kromatiinirakenteen avulla, sitä avaamalla tai sulkemalla. Hienovarainen tasapaino saavutettavien ja suljettujen säätelyalueiden välillä muuttuu merkittävästi syöpä- soluissa. Eturauhassyövässä androgeenillä on keskeinen rooli jatkuvan syöpäkasvun ylläpitämisessä, ja se on myös yleinen hoitokohde. Hoitojen seurauksena noin kolmasosa eturauhassyöpäkasvaimista kehittyy aggressiivisiksi, androgeenista riippumattomiksi kasvaimiksi, joita kutsutaan yleisesti nimellä kastrattioresistentti etu- rauhassyöpä (castration resistant prostate cancer, CRPC). Tiettyjen geneettisten muutosten tiedetään johtavan eturauhassyövän tai sen kastraatioresistentin muodon kehittymiseen. Näistä lähtökohdista voidaan olettaa, että kromatiinirakenteen, gee- nien ilmenemisen ja eurauhassyövän etenemisen välillä on yhteys . Väitöskirjassa kromatiinirakennetta tarkasteltiin ATAC-seq (transposase-accessible chromatin cou- pled with sequencing) - menetelmällä Tampereen yliopistollisessa sairaalassa kerätyistä potilaiden eturauhassyöpänäytteistä, jotka edustivat syövän eri vaiheita. Analyysissä hyödynnettiin aikaisemmin samoista näytteistä tuotettua geenien ilmenemisdataa (RNA-seq), sekä julkisesti saatavilla olevaa transkriptiotekijöiden sitoutumisdataa (ChIP-seq). ATAC-seq datan avulla tunnistimme useita syöpään liittyviä muutoksia kromatiinin rakenteessa. Yhdistämällä havaitut kromatiinirakenteen muutokset geenien ilmenemismuutoksiin pystyimme liittämään geenit säätelyalueisiinsa. Vaikka koko genomin mittakaavassa yhteydet säätelyalueiden ja geenien ilmentymistasojen välillä olivat heikkoja, syövän etenemiseen liittyvien geenien säätelyalueiden muutokset liittyivät selkeämmin niiden ilmenemiseen. Saadut tulokset tukevat ajatusta siitä, että eturauhassyövän etenemiselle on tunnusomaista transkriptiotekijöiden sitoutumiskohtien muuttuminen patologisella tavalla.
Ymmärtääksemme, mitkä transkriptiomekanismit liittyvät syövän kehittymiseen ja etenemiseen, kävimme läpi transkriptiotekijöiden sitoutumisalueita ChIP-seq datan perusteella. Androgeenireseptorilla (AR) oli suurin määrä sitoutumiskohtia ATAC-seq-analyysissa havaituilla muuttuneilla kromatiinialueilla. Lisäksi FOXA1 ja HOXB13 transkriptiotekijöiden havaittiin sitoutuvan samoihin kohtiin androgeenire- septorin kanssa alueilla, jotka avautuivat aikaisen vaiheen eturauhassyövissä ja sulkeu- tuivat CRPC:ssä. Saatu havainto tukee AR-geenin keskeistä roolia eturauhassyövän etenemisessä ja saa pohtimaan, mitkä transkriptiotekijät liittyvät sen aktiivisuuden muokkaamiseen CRPC:ssä. Vastataksemme tähän kysymykseen tunnistimme tran- skriptiotekijäjoukkoja, joilla on paljon yhteisiä kohdegeenejä. Transkriptiotekijöiden ryhmittely hierarkisen klusteroinnin avulla paljasti kaksi ryhmää: Ensimmäiseen ryhmään kuuluivat geenit AR, ERG, FOXA1 ja ESR1, jotka muodostavat AR-säätelyn perustan ja liittyvät vahvasti toisiinsa. Toiseen ryhmään kuului 43 transkriptiotekijää, joilla oli vähemmän yhteisiä kohdegeenejä. Saatu tulos validoi AR-geenin keskeistä roolia ja nostaa esiin muiden säätelijöiden, kuten SP1:n, FLI1:n ja TP63:n, merkityksen AR:n rinnakkaissäätelijöinä .
Kaikilla transkriptiotekijöillä on samankaltainen proteiinirakenne: ne sisältävät DNA-sitoutumisdomeenin ja vähintään yhden säätelyyn liittyvä domeenin eli pro- teiinin osa-alueen. Tämän lisäksi kaikilla on vähintään yksi rakenteellisesti järjestäytymätön domeeni. Nämä järjestäytymättömätömät alueet ovat taipuisia, vain lievästi hydrofobisia, eikä niillä tyypillisesti ole sähkövarausta. Järjestäymättömän proteiinirakenteen omaavilla proteiineilla (intrinsically disordered proteins, IDPs) on nesteessä useita mahdollisia rakenteita jotka voivat vaihdella satunnaisesta rihmasta täysin järjestäyneeksi , laskostuneeksi muodoksi. DisProt-tietokanta luotiin näitä proteiineja tutkivan kirjallisuuden kartoittamiseksi ja yhteenkokoamiseksi. Uusi verkkosivusto luotiin ohjaamaan julkaistun tiedon kuratointia ja tietokanta toteutettiin uutena verkkosovelluksena. Vaikka DisProt tietokannan data on huippulaatuista, sen sisältämän tiedon määrä on vielä rajallinen. MobiDB- tietokanta luotiin lisäksi, jotta järjestymättömien alueiden annotointi voidaan tehdä kattavasti kaikille tunnetuille proteiineille . ModiDB tietokantaan on kerätty tietoja yhdestätoista eri tietokannasta ja viisitoista eri algoritmia järjestäytymättömän proteiiniraken- teen, proteiinin sekundäärirakenteen ja epätyypillisen aminohappokoostumuksen omaavien alueiden ennustamista varten. Näiden työkalujen avulla analysoimme edellämainittujen transkriptiotekijöiden DNA-sitoutumisdomeenien ja järjestymättömien alueiden rakennetta. Nämä tulokset osoittavat kuinka eri tyyppisten uuden sukupolven sekvensointimenetelmien tulosten analysointi yhdessä auttaa selvittämään monimutkaisia säätelyprosesseja. Transkriptiotekijöiden analyysillä voidaan paremmin ymmärtää eturauhassyövän syntyä ja etenemistä kastraatioresistentiksi muodoksi. Lisäksi kehitettyjen menetelmien avulla pystytään selvittämään tunnistettujen transkriptiotekijöiden proteiiniakennetta. Väitöskirjassa saadut tulokset tarjoavat yleiskuvan solunsisäisten prosessien monimutkaisuudesta ja tuovat esiin lasken- nallisia lähestymistapoja tauteihin liittyvien transkriptiotekijöiden tunnistamiseksi ja karakterisoimiseksi.
Ymmärtääksemme, mitkä transkriptiomekanismit liittyvät syövän kehittymiseen ja etenemiseen, kävimme läpi transkriptiotekijöiden sitoutumisalueita ChIP-seq datan perusteella. Androgeenireseptorilla (AR) oli suurin määrä sitoutumiskohtia ATAC-seq-analyysissa havaituilla muuttuneilla kromatiinialueilla. Lisäksi FOXA1 ja HOXB13 transkriptiotekijöiden havaittiin sitoutuvan samoihin kohtiin androgeenire- septorin kanssa alueilla, jotka avautuivat aikaisen vaiheen eturauhassyövissä ja sulkeu- tuivat CRPC:ssä. Saatu havainto tukee AR-geenin keskeistä roolia eturauhassyövän etenemisessä ja saa pohtimaan, mitkä transkriptiotekijät liittyvät sen aktiivisuuden muokkaamiseen CRPC:ssä. Vastataksemme tähän kysymykseen tunnistimme tran- skriptiotekijäjoukkoja, joilla on paljon yhteisiä kohdegeenejä. Transkriptiotekijöiden ryhmittely hierarkisen klusteroinnin avulla paljasti kaksi ryhmää: Ensimmäiseen ryhmään kuuluivat geenit AR, ERG, FOXA1 ja ESR1, jotka muodostavat AR-säätelyn perustan ja liittyvät vahvasti toisiinsa. Toiseen ryhmään kuului 43 transkriptiotekijää, joilla oli vähemmän yhteisiä kohdegeenejä. Saatu tulos validoi AR-geenin keskeistä roolia ja nostaa esiin muiden säätelijöiden, kuten SP1:n, FLI1:n ja TP63:n, merkityksen AR:n rinnakkaissäätelijöinä .
Kaikilla transkriptiotekijöillä on samankaltainen proteiinirakenne: ne sisältävät DNA-sitoutumisdomeenin ja vähintään yhden säätelyyn liittyvä domeenin eli pro- teiinin osa-alueen. Tämän lisäksi kaikilla on vähintään yksi rakenteellisesti järjestäytymätön domeeni. Nämä järjestäytymättömätömät alueet ovat taipuisia, vain lievästi hydrofobisia, eikä niillä tyypillisesti ole sähkövarausta. Järjestäymättömän proteiinirakenteen omaavilla proteiineilla (intrinsically disordered proteins, IDPs) on nesteessä useita mahdollisia rakenteita jotka voivat vaihdella satunnaisesta rihmasta täysin järjestäyneeksi , laskostuneeksi muodoksi. DisProt-tietokanta luotiin näitä proteiineja tutkivan kirjallisuuden kartoittamiseksi ja yhteenkokoamiseksi. Uusi verkkosivusto luotiin ohjaamaan julkaistun tiedon kuratointia ja tietokanta toteutettiin uutena verkkosovelluksena. Vaikka DisProt tietokannan data on huippulaatuista, sen sisältämän tiedon määrä on vielä rajallinen. MobiDB- tietokanta luotiin lisäksi, jotta järjestymättömien alueiden annotointi voidaan tehdä kattavasti kaikille tunnetuille proteiineille . ModiDB tietokantaan on kerätty tietoja yhdestätoista eri tietokannasta ja viisitoista eri algoritmia järjestäytymättömän proteiiniraken- teen, proteiinin sekundäärirakenteen ja epätyypillisen aminohappokoostumuksen omaavien alueiden ennustamista varten. Näiden työkalujen avulla analysoimme edellämainittujen transkriptiotekijöiden DNA-sitoutumisdomeenien ja järjestymättömien alueiden rakennetta. Nämä tulokset osoittavat kuinka eri tyyppisten uuden sukupolven sekvensointimenetelmien tulosten analysointi yhdessä auttaa selvittämään monimutkaisia säätelyprosesseja. Transkriptiotekijöiden analyysillä voidaan paremmin ymmärtää eturauhassyövän syntyä ja etenemistä kastraatioresistentiksi muodoksi. Lisäksi kehitettyjen menetelmien avulla pystytään selvittämään tunnistettujen transkriptiotekijöiden proteiiniakennetta. Väitöskirjassa saadut tulokset tarjoavat yleiskuvan solunsisäisten prosessien monimutkaisuudesta ja tuovat esiin lasken- nallisia lähestymistapoja tauteihin liittyvien transkriptiotekijöiden tunnistamiseksi ja karakterisoimiseksi.
Kokoelmat
- Väitöskirjat [4901]