Avaa lukukehys - Open reading frame
In molekyyligenetiikan , avoin lukukehys ( ORF ) on osa lukukehyksen , jolla on kyky olla käännetty . ORF on jatkuva venytys kodoneja , jotka voivat alkaa aloituskodoni (yleensä elokuu) ja päättyy lopetuskodoniin (tavallisesti UAA, UAG tai UGA). ATG -kodoni (AUG RNA: ssa ) ORF: ssä (ei välttämättä ensimmäinen) voi osoittaa, mistä käännös alkaa. Transkription päättyminen Sivusto sijaitsee jälkeen ORF, yli käännöksen lopetuskodoni . Jos transkriptio lakkaisi ennen stop -kodonia, epätäydellinen proteiini muodostuisi translaation aikana. On eukaryoottisten geenien useita eksonit , intronit poistetaan ja eksonit yhdistetään sitten kun transkription, jolloin saatiin lopullinen mRNA: n ja proteiinin translaation. Geenin löytämisen yhteydessä ORF: n aloitus-lopetus- määritelmä koskee siis vain silmukoituja mRNA: ita, ei genomista DNA: ta, koska intronit voivat sisältää stop-kodoneja ja/tai aiheuttaa siirtymiä lukukehysten välillä. Vaihtoehtoinen määritelmä sanoo, että ORF on sekvenssi, jonka pituus on jaollinen kolmella ja jota rajoittavat stop -kodonit. Tämä yleisempi määritelmä voi olla hyödyllinen myös transkriptomiikan ja/tai metagenomiikan yhteydessä , jossa alku- ja/tai lopetuskodonia ei välttämättä ole läsnä saaduissa sekvensseissä. Tällainen ORF vastaa geenin osia eikä koko geeniä.
Biologinen merkitys
Yksi yhteinen käyttö avointa lukukehystä (ORF: t) on yksi todiste auttamaan geenin ennustaminen . Pitkiä ORF: itä käytetään usein muiden todisteiden ohella tunnistamaan aluksi ehdokasproteiinia koodaavat alueet tai toiminnalliset RNA: ta koodaavat alueet DNA -sekvenssissä. ORF: n läsnäolo ei välttämättä tarkoita, että alue käännetään aina . Esimerkiksi satunnaisesti muodostetussa DNA-sekvenssissä, jossa on sama prosenttiosuus kutakin nukleotidia , stop-kodonia odotettaisiin kerran 21 kodonin aikana . Yksinkertainen geeni ennuste algoritmi prokaryooteille voi etsiä aloituskodoni , jota seurasi avoin lukukehys, joka on tarpeeksi pitkä koodata tyypillinen proteiini, jossa kodonien käyttö tämän alueen vastaa taajuus ominaista tietyn organismin koodaavat alueet. Siksi jotkut kirjoittajat sanovat, että ORF: n tulisi olla vähimmäispituus, esim. 100 tai 150 kodonia. Jopa pitkä avoin lukukehys ei yksinään ole ratkaiseva todiste geenin läsnäolosta . Toisaalta on osoitettu, että jotkut lyhyet ORF: t (sORF), joista puuttuu proteiinia koodaavien geenien klassiset tunnusmerkit (sekä ncRNA: sta että mRNA: sta), voivat tuottaa toiminnallisia peptidejä. Noin 50%: n nisäkkäiden mRNA: iden 5'-UTR: n tiedetään sisältävän yhden tai useamman sORF: n. 64–75% kokeellisesti löydetyistä sORF -translaation aloituskohdista on säilynyt ihmisen ja hiiren genomeissa, ja ne voivat osoittaa, että näillä elementeillä on toimintaa. Kuitenkin sORF: ita löytyy usein vain pienistä mRNA -muodoista ja ne välttävät valinnan; aloituskohtien korkea konservatiivisuus voi liittyä niiden sijaintiin asiaankuuluvien geenien promoottoreiden sisällä. Tämä on ominaista esimerkiksi SLAMF1 -geenille.
Kuuden kehyksen käännös
Koska DNA: ta tulkitaan kolmen nukleotidin (kodonien) ryhmissä, DNA -juosteella on kolme erillistä lukukehystä. DNA-molekyylin kaksoiskierre sisältää kaksi yhdensuuntaista lankaa; kun kahdella säikeellä on kolme lukukehystä, on kuusi mahdollista kehyksen käännöstä.
Ohjelmisto
Finder
ORF Finder (Open Reading Frame Finder) on graafinen analyysityökalu, joka löytää kaikki avoimet lukukehykset, jotka ovat valitun vähimmäiskokoisen käyttäjän tai tietokannan järjestyksessä. Tämä työkalu tunnistaa kaikki avoimet lukukehykset käyttämällä vakio- tai vaihtoehtoisia geneettisiä koodeja. Päätelty aminohapposekvenssi voidaan tallentaa eri muodoissa ja hakea sekvenssitietokantaa käyttäen käyttämällä paikallista peruskohdistushakutyökalua (BLAST). ORF Finderin pitäisi olla hyödyllinen valmisteltaessa täydellisiä ja tarkkoja sekvenssilähetyksiä. Se on myös pakattu Sequin -sekvenssin lähetysohjelmistolla (sekvenssianalysaattori).
Tutkija
ORF Investigator on ohjelma, joka ei ainoastaan anna tietoa koodaavista ja ei -koodaavista sekvensseistä, vaan voi myös suorittaa eri geenien/DNA -alueiden sekvenssien globaalin linjauksen pareittain. Työkalu löytää tehokkaasti vastaavien aminohapposekvenssien ORF: t ja muuntaa ne yksikirjaimisiksi aminohappokoodeiksi ja antaa niiden sijainnin sekvenssissä. Sekvenssien välinen globaali linjaus pareittain tekee eri mutaatioiden havaitsemisen käteväksi, mukaan lukien yksittäisen nukleotidin polymorfismi . Needleman -Wunsch -algoritmeja käytetään geenien kohdistamiseen. ORF Investigator on kirjoitettu kannettavalla Perl -ohjelmointikielellä , joten se on kaikkien yleisten käyttöjärjestelmien käyttäjien saatavilla.
Ennustaja
OrfPredictor on verkkopalvelin, joka on suunniteltu tunnistamaan proteiinia koodaavat alueet ekspressoidusta sekvenssitunnisteesta (EST) peräisin olevista sekvensseistä. Kyselyjaksoille, joilla on osuma BLASTX: ssä, ohjelma ennustaa koodausalueet BLASTX -kohdistuksissa tunnistettujen käännöslukukehysten perusteella, muuten se ennustaa todennäköisimmän koodausalueen kyselysekvenssien sisäisten signaalien perusteella. Tulos on ennustettu peptidisekvenssi FASTA -muodossa ja määritelmärivi, joka sisältää kyselyn tunnuksen, käännöksen lukukehyksen ja nukleotidiasemat, joissa koodaava alue alkaa ja päättyy. OrfPredictor helpottaa EST: stä peräisin olevien sekvenssien merkintöjä erityisesti suurissa EST-projekteissa.
ORF Predictor käyttää edellä mainittujen kahden eri ORF -määritelmän yhdistelmää. Se etsii osuuksia, jotka alkavat aloituskodonista ja päättyvät lopetuskodoniin. Lisäkriteerinä se etsii pysäytyskodonia 5 ' kääntämättömältä alueelta (UTR tai NTR, ei -transloitu alue ).
ORFik
ORFik on R-paketti Bioconductorissa avoimien lukukehysten löytämiseksi ja seuraavan sukupolven sekvensointitekniikoiden käyttämiseksi ORF: ien oikeuttamiseksi.
orfipy
orfipy on työkalu, joka on kirjoitettu Python/Cython -ohjelmalla ORF -tiedostojen erottamiseksi erittäin nopeasti ja joustavasti. orfipy voi työskennellä tavallisilla tai gzipped FASTA- ja FASTQ-sekvensseillä ja tarjoaa useita vaihtoehtoja hienosäätää ORF-hakuja; Näitä ovat aloitus- ja lopetuskodonien määrittäminen, osittaisten ORF -raporttien ilmoittaminen ja mukautettujen käännöstaulukoiden käyttö. Tulokset voidaan tallentaa useissa muodoissa, mukaan lukien tilaa säästävä BED-muoto. orfipy on erityisen nopeaa datalle, joka sisältää useita pienempiä FASTA-sekvenssejä, kuten de-novo-transkriptokokoonpanoja.
Katso myös
- Koodausalue
- Oletettu geeni
- Sequerome - järjestyksessä profilointityökalun että linkit jokaisen BLAST tietueen NCBI ORF mahdollistaa täydellisen ORF analyysin BLAST raportin.
Viitteet
Ulkoiset linkit
- Käännös- ja avoimet lukukehykset
- hORFeome V5.1 - Web -pohjainen interaktiivinen työkalu CCSB Human ORFeome Collectionille
- ORF Marker - Ilmainen, nopea ja monialustainen työpöydän graafinen käyttöliittymä työkalu ORF: ien ennustamiseen ja analysointiin
- StarORF -Monialustainen java-pohjainen graafinen käyttöliittymä työkalu ORF: ien ennustamiseen ja analysointiin sekä käänteisen komplementtisekvenssin saamiseen
- ORFPredictor - Verkkopalvelin, joka on suunniteltu ORF -ennustamiseen ja EST- tai cDNA -sekvenssien erän kääntämiseen