Mereimetajate genoomide ühtlane areng | loodusgeneetika

Mereimetajate genoomide ühtlane areng | loodusgeneetika

Anonim

Õppeained

  • Funktsionaalne genoomika
  • Genoomika

Abstraktne

Erinevatel imetajarühmadel esinevatel mereimetajatel on mitu veekeskkonnaga kohandatud fenotüübilist iseloomujoont ja kujutavad endast seetõttu ühtlase evolutsiooni klassikalist näidet. Ühtlase evolutsiooni uurimiseks genoomilisel tasandil sekveneerisime ja viisime läbi mereimetajate kolme liigi (tapmisvaal, roospuu ja manaaž) genoomide de novo kokkupanemise kolmelt imetajakogult, millel on iseseisvalt kujunenud fenotüübilised kohandused mere olemasoluga. Meie võrdlevates genoomianalüüsides leiti, et ühtlustuvad aminohapete asendused olid kogu genoomis laialt levinud ja et nende asenduste alamhulk oli geenides, mis arenesid välja positiivse selektsiooni all ja seostati oletatavalt mere fenotüübiga. Kuid mereimetajate maapealsete õdede taksonite kontrollkomplektis leidsime kõrgemat ühtlustunud aminohappeasenduste taset. Meie tulemused viitavad sellele, et kuigi koonduv molekulaarne evolutsioon on suhteliselt tavaline, on fenotüüpse lähenemisega seotud adaptiivne molekulaarne lähenemine suhteliselt haruldane.

Peamine

Ehkki sama fenotüüpse tulemuse saavutamiseks on potentsiaalselt mitu genoomset viisi, on pakutud, et konvergentse evolutsiooni aluseks olevad genoomsed muutused võivad mingil määral olla reprodutseeritavad ja samadest geneetilistest muutustest 1, 2, 3 tingituna võivad tavaliselt tekkida konvergentsed fenotüübilised tunnused. Fenotüüpne lähenemine on tõepoolest seotud valku kodeeriva geeni kodeeritud toote üksikute aminohapete identsete asendamistega, mis toimuvad sõltumatult omavahel seotud taksonites 4, 5 ; sellised näited on siiski haruldased ja meile teadaolevalt pole üheski varasemas uuringus genoomi hõlmavat skannimist selliste ühtlusuvate asenduste jaoks läbi viidud. Siin tutvustame suure katvusega terve genoomi järjestusi neljale mereimetajaliigile: rooshernel ( Odobenus rosmarus ), vill-delfiinil ( Tursiops truncatus ), tapmisvaalil ( Orcinus orca ) ja Lääne-India maneetil ( Trichechus manatus latirostris ). Need genoomid pakuvad ainulaadset võimalust käsitleda evolutsiooni võtmeküsimust selle kohta, milline roll on molekulaarsel lähenemisel olnud ühiste fenotüübiliste kohanemiste kujunemisel uues keskkonnas 6 .

Imetajad on asunud elama merekeskkonda mitmel iseseisval korral. Vaalalised (vaalid, delfiinid ja pringlid) ja sireenid (manaadid ja dugongid) tekkisid eokeeni ajastul 7, 8, 9, 10, mitmekesistades vastavalt Cetartiodactyla ja Aafrika. Käsnurgad (hülged, merilõvid ja harilikud mädanikud) tekkisid umbes 20 miljonit aastat hiljem Carnivora seest pärit müokeeni ajal 7, 8 . Vaatamata nende iseseisvale evolutsioonilisele päritolule, on kährikutel, sireenidel ja vaalalistel mitmeid fenotüüpseid kohandusi vee olemasoluga seotud patogeensete, lokomotoorsete, termiliste, sensoorsete, kommunikatsiooniliste ja anaeroobsete väljakutsetega, sealhulgas ujumiseks kohandatud jäsemetega, luude tihedusega ujuvuse juhtimiseks ja suur üldhapnikuvaru keha suuruse suhtes 6, 7, 8 .

Sekreteerisime ja viisime läbi tapmisvaala, manaati ja mädarõika genoomide de novo kokkupanekut ning suurendasime villilise delfiini eelmise genoomi kavandit, rakendades kogu genoomi haavlipüssistrateegiat, kasutades platvorme Roche 454 ja Illumina HiSeq (täiendav tabel 1). . Seejärel ennustasime 4 mereimetajate genoomi ja 6 teise imetaja genoomi (inimese, alpaka, lehma, koera ja elevandi, opossum kui järelgruum; täiendav tabel 2) 16 878 ortoloogset geeni. Pärast filtreerimist hõlmasime 14 883 valku kodeerivat ortoloogit tapmisvaala jaoks, 10 597 delfiini, 15 396 mära ja 14 674 manaati jaoks.

Uurisime nende liikide molekulaarset lähenemist kahel tasandil: esiteks tuvastasime valke kodeerivad geenid, mis arenevad positiivse valiku alusel kõigis kolmes järjekorras; teiseks tuvastasime nendes geenides kodeeritud konvergentsed aminohappeasendused. Positiivse valiku korral arenevate geenide tuvastamiseks viisime läbi neljast erinevast tõenäosussuhte testist koosneva seeria, üks kombineeritud mereimetajate harudel ja üks kõigil üksikutel harudel, mis viivad manaati, mädarõigast ja delfiini ning tapmisvaala sisaldavasse järjekorda (vt punased värvilised oksad joonisel 1). Pärast mitmetestiliste uuringute konservatiivset korrigeerimist tuvastasime kombineeritud mereimetajate harudes positiivse valiku alusel 191 geeni (täiendav tabel 3). Need viis geeni sisaldasid glutatiooni metabolismi raja geeni ANPEP . Eksperimentaalselt on tõestatud, et glutatioon suurendab vaalaliste rakkude antioksüdantset võimet ja arvatakse, et see hoiab ära reaktiivsete hapnikuliikide kahjustusi pikkade veealuste sukeldumiste hüpoksilistes tingimustes 11 (täiendav joonis 1). Selles geenis ei olnud mereimetajate igas harus paralleelseid asendusi. Kuid tuvastasime veel ühe glutatiooni metabolismi raja geeni, GCLC , mis arenes positiivse selektsiooni all kombineeritud mereimetajate harudes (enne korrigeerimist mitmekordseks testimiseks), mis kodeeris identset asendust kõigis kolmes harus (tabel 1).

Image

Harud, mis esindavad mereimetajate sugupuude iseseisvat arengut, mille jaoks tehti positiivse selektsiooni testid ja paralleelsed mittesünonüümsed aminohappeasendused, on punaseks värvitud. Maapealsete taksonite kontrollkomplekti harud, mille jaoks tehti ka positiivse selektsiooni testid ja paralleelsed mittesünonüümsed aminohappeasendused, on värvitud mustaks. Mereimetajate illustratsioonid on Uko Gorter.

Täissuuruses pilt

Täissuuruses tabel

Sellised paralleelsed mittesünonüümsed muutused kodeerimisgeenides, mis kaardistavad samu aminohappelisi saite rohkem kui ühes mereimetajate liinis, olid genoomis laialt levinud (joonis 2). Näiteks toimus kõigis kolmes mereimetajate liinis 44 paralleelset mittesünonüümset aminohappeasendust; need asendused moodustasid 0, 05% kõigist mittesünonüümsetest muutustest. Paralleelsed muutused kahe mereimetajate liini vahel ilmnesid veelgi kiiremini, hõlmates üle 1% kõigist kahe mereimetajate liini kombinatsiooni kõikidest muutustest (täiendav tabel 4). See muster püsis, kui maskeerisime hüpermutableeritavaid CpG saite (täiendav tabel 5).

Image

Mereimetajate genoomides ilmnes suur arv paralleelseid asendusi (siniseid), mis toimusid vähemalt kahe mereimetajate sugukonna hargnemiskohas, kuna need arenesid välja maapealsest esivanemast. Paralleelsed asendused, mis toimusid positiivselt valitud geenides, on punaseks värvitud.

Täissuuruses pilt

Leidsime 44-st identsest mittesünonüümsest aminohappeasendusest 15 kõigist 3 mereimetajate liinist, mis olid kodeeritud geenides, mis arenesid positiivse selektsiooni all vähemalt ühes suguluses; Järeldati, et 8 neist geenidest arenesid testis positiivse valiku korral, hõlmates kõiki kolme mereimetajate sugukonda (joonis 2 ja tabel 1). See leid on kooskõlas teoreetiliste mudelitega, mis näitavad, et positiivse valiku korral suureneb paralleelse molekulaarse evolutsiooni tõenäosus 12 . Kõigil muudel kui kolmel juhul olid need mittesünonüümsed aminohappeasendused tingitud identsetest nukleotiidimuutustest (täiendav tabel 6). Ainult kaks nukleotiidimuutust toimusid hüpermuteeruvates CpG saitides ja kummalgi juhul ei olnud mutatsioon tingitud tsütosiini metüülimisest ja saadud 5-metüültsütosiini järgnevast deamiinimisest tümidiiniks (protsess, mis muudab CpG saidid kõrgeks mutatsioonikiiruseks 13 ). Kaaludes 260 mitteidentist aminohappeasendust, mis mõjutavad sama alust kõigis kolmes mereimetajate liinis, leidsime üle 25% (72) geenidest, mis arenevad positiivse valiku korral vähemalt ühes mereimetajate liinis (täiendav tabel 7).

Nende paralleelsete asenduste täpset fenotüübilist mõju ei saa praegu kindlaks teha; siiski on paljudel 15 positiivse selektsiooni geenist teada funktsionaalsed seosed, mis viitavad rollile mereimetajate sugupuude fenotüüpsele evolutsioonile (täiendav tabel 8). Näiteks S100A9 ja MGP kodeerivad kaltsiumi siduvaid valke, millel on roll luude moodustumisel 14, 15, SMPX- l on roll kuulmisel ja sisekõrva moodustumisel 16, C7orf62-l on teada seosed hüpertüreoidismiga 17, MYH7B- l on roll südamelihas 18 ja SERPINC1 reguleerib vere hüübimist 19 . Neid geene saab seetõttu seostada sarnaste fenotüüpiliste tunnustega, nagu luutiheduse muutused ( S100A9 ja MGP ), mis on madalas sukeldumises kasutatavates liikides, näiteks manaatides ja roostes, neutraalse ujuvuse ületamiseks kõrge, kuid sügavalt sukelduvate vaalaliste liikide puhul, mis varisevad kokku, madalad nende kopsud, et ületada neutraalset ujuvust. Nende geenide täiendavad funktsionaalsed assotsiatsioonid jagatud merefenotüüpidega hõlmavad kuulmisnärvi moodustumist ja eraldamist sisekõrva koljust ( SMPX ), ebatavalist perioodilist kilpnäärme aktiivsust ( C7orf62 ), kardiovaskulaarset regulatsiooni sukeldumise ajal ( MYH7B ) ja madalat viskoosse vere voolukiirus, eriti sukeldumise ajal ( SERPINC1 ) 7, 8 .

Sellesse uuringusse kaasatud mereimetajad kuuluvad kolme taksonoomiliselt kauge imetajate klassi; seetõttu võib genoomi 3, 20 piirkondade püsiv geneetiline varieeruvus ja lokaalne introgressioon välistada kui genoomi lähenemise tõenäolised põhjused. Identsed de novoasendused peavad seetõttu olema toimunud igas taksonis iseseisvalt maapealsest esivanemast evolutsiooni ajal. Kui enamik neist oletatavalt kohanemisvõimelistest konvergentsetest asendustest olid olemas ka hiljuti avaldatud minikaalude genoomis 11, siis geenide MYH7B , S100A9 ja GPR97 konvergentsed asendused ei viidanud sellele, et need kas tuletati hammasvaalides (Odontoceti) või kadusid baleenvaalad (Mysteceti) pärast Odontoceti ja Mysteceti lahknemist.

Üllataval kombel leidsime mereimetajate (täiendav joonis 2 ja täiendavad tabelid 4 ja 5) maapealsete õdede taksonite (lehm, koer ja elevant) kombineeritud harudes ootamatult kõrge ühtlustumise taseme, mille jaoks puudub ilmne fenotüüp lähenemine. See leid viitab sellele, et nii adaptiivsete kui ka neutraalsete asenduste võimalused paljudes geenides võivad olla piiratud, võib-olla seetõttu, et alternatiivsetes kohtades tehtud asendustel on pleiotroopne ja kahjulik mõju (täiendav tabel 8).

Meie mereimetajate genoomide võrdlus tõi välja paralleelsed molekulaarsed muutused geenides, mis arenevad positiivse valiku käigus ja mis on oletatavasti seotud iseseisvalt arenenud adaptiivse fenotüüpse lähenemisega. On püstitatud hüpotees, et adaptiivne evolutsioon võib soodustada saadaolevate asenduste kallutatud alamhulka, et maksimeerida fenotüübilisi muutusi 1, 2, 3, ja see hüpotees võib seletada mõnda meie järeldust mereimetajate seas valitsevast molekulaarsest evolutsioonist. Siiski leidsime maapealsete õdede taksonite hulgas ka laialdast molekulaarset lähenemist, mis viitab sellele, et paralleelsed asendused ei pruugi tavaliselt põhjustada fenotüüpse lähenemist. Enamiku mutatsioonide pleiotroopne ja sageli kahjulik olemus võib viia asenduste pikaajalise püsimiseni piiratud arvul saitides, jättes signaali molekulaarsele lähenemisele mõne kodeeriva geeni sees. Selles uuringus tuvastatud paralleelsed asendused 15 positiivselt valitud geenis esindavad tõenäoliselt väikest osa molekulaarsetest muutustest, mis on aluseks mereimetajate adaptiivse ja koonduva fenotüüpse arengule. Seetõttu näitavad meie andmed, et kuigi konvergentsest molekulaarsest evolutsioonist võib tuleneda ühtlane fenotüüpne areng, on need juhtumid haruldased ja evolutsioon kasutab sama fenotüüpse tulemuse saavutamiseks sagedamini erinevaid molekulaarseid teid.

Meetodid

Proovide kogumine ja DNA ekstraheerimine.

DNA koguti neljalt mereimetajate liigilt, tapmisvaalilt ( O. orca ), vill-delfiinilt ( T. truncatus ), Vaikse ookeani kährikult ( O. rosmarus divergens ) ja Lääne-India manatee ( T. manatus ) Florida alamliigilt latirostris ). Emane tapmisvaal 'Morgan' luhtus Hollandi rannikule ja viidi seejärel Harderwijki dolfinaariumisse. Morgani mitokondriaalse DNA järjestuse ja õpitud häälerepertuaari võrdlus Põhja-Atlandi andmebaasiga näitas, et ta oli pärit tapmisvaalade populatsioonist, kes söödavad peamiselt atlandi heeringa, Clupea harengus 21 Norra kevadisel kudekarjal. Võeti 10-ml täisvereproov, mida hoiti viivitamatult vastavalt PAXgene Blood DNA tuubis ja PAXgene Blood RNA tuubis vastavalt DNA ja RNA ekstraheerimiseks. Viis Norra rannikuvetes Atlandi heeringat toitnud tapjavaala täiendavad biopsiaproovid koguti ja säilitati kohe säilitusaines RNAlater. RNA ekstraheeriti ja liideti Qiagen RNeasy Mini komplekti abil ja järgides tootja juhiseid viie vabalt leviva tapmisvaala homogeniseeritud nahabiopsiatest. Vereproovid võeti sarnaselt kahest Harderwijki Dolfinaariumist pärit kõrtsist: Alaska isalt ('Igor'), kusjuures proovi hoiti kohe kogu genoomi sekveneerimiseks PAXgene'i vere DNA katseklaasis ja Wrangeli saare naiselt ('Natasja')., kusjuures proovi hoiti kohe RNA sekveneerimiseks PAXgene Blood RNA katseklaasis, et aidata kaasa genoomi annoteerimisele. DNA ja RNA ekstraheeriti täisverest, kasutades vastavalt PAXgene Blood DNA komplekti ja PAXgene Blood RNA komplekti, järgides tootja juhiseid. Bottlenose delfiinide koeproovid saadi USA mereväe mereimetajate programmis delfiinide lahangute korral lahangu käigus. Põrna-, maksa-, neeru- ja nahaproovid olid emasloomadelt ja lihased isasloomadelt. Pärast standardmeetoditega valmistamist kasutati proove cDNA järjestamiseks. Lõpuks koguti vereproovid ja DNA ekstraheeriti vangistuses sündinud naissoost Florida manateest 'Lorelei', mille proovid tehti Homosassa Springsi metsloomade looduspargis Homosassa, Florida, USA-s, standardsete protokollide järgi.

DNA ja RNA järjestamine ja kokkupanek.

Terve genoomi haavlipüsside järjestused genereeriti, kasutades Illumina HiSeq platvormi DNA-raamatukogudest, mis hõlmasid vaala, kährikut, manaati ja vill-delfiini. Delfiinide genoom oli eelnevalt läbinud Sangeri sekveneerimise 2-kordse katvusega; raamatukogu ja sekveneerimise protokolle on varem kirjeldatud 22 . Delfiinide komplekt valmistati, koondades ∼ 2, 5 × Sangeri järjestamisandmed ∼ 3, 5 × Roche 454 FLX fragmendi andmete ja ∼ 30 × Illumina HiSeq andmetega. Sangeri sekveneerimine ja 454 andmed ühendati Atlase koostajaga ning seejärel kasutati Illumina andmete lisamiseks, tellingute parandamiseks ja tellingutes lünkade täitmiseks Atlas-Link ja ATLAS GapFill.

De novo sõlmede valmistamisel kasutati sarnaseid meetodeid, mida kasutati Assemblathon II võrdluses. Esialgne komplekt loodi, kasutades kõigi jadaandmete korral AllPath-LG vaikeparameetritega ja MIN_CONTIG = 300, välja arvatud raamatukogude andmed, mille sisestusmaht on 500 aluspaari. Esialgsest montaažist tellinguid pikendati veelgi, kasutades Atlas-Linki, tuginedes raamatukogude pakutavale teabele, mille sisestussuurused olid 3 kb ja 8 kb. ATLAS GapFill kasutati seejärel tellingutes olevate lünkade täitmiseks, koondades iga tühimikuga seotud kohad kohapeal. Vastavalt tapmisvaalale ja roosile koondati need loendid süvise genoomideks, mille jätkuvad N50 suurused olid 70, 3 kb ja 90, 0 kb ning karkassi N50 suurused olid 12, 7 Mb ja 2, 6 Mb (täiendav tabel 1). 2249 MB ja 2300 Mb suurused sõlmed hõlmasid vastavalt umbes 85% ja 95% hinnanguliselt vastavalt 2 373 Mb (tapmisvaal) ja 2400 Mb (roos). Parandatud delfiinide koostise jätk N50 oli 11, 9 kb ja karkassi N50 suurus oli 115 kb. Genoomi kokku pandud suurus oli 2, 33 Gb (tühimikega 2, 55 Gb) ja kattis umbes 95, 3% genoomist.

Manateeni järjestamine ja kokkupanek varieerus pisut teiste mereimetajate puhul kasutatud meetodist: manatee DNA sekveneeriti Illumina sekveneerimise tehnoloogiaga 90-kordseks kogukatteks, mis hõlmas 45-kordset raamatukogude katvust suurusega 180 aluspaari, 42 × kärbitud hüpperaamatukogude katvus fragmendi suurusega 3 kb, 2 × nihutatud hüplike raamatukogude katvus fragmendi suurusega 6–14 kb ja 1 × fosmiidi hüpperaamatukogude katvus 23 . Järjestus monteeriti seejärel, kasutades ALLPATHS-LG 24 . Eelnõu komplekt oli 3, 10 Gb ja koosnes 2, 77 Gb järjestusest, millele lisandusid kontiikide vahelised lüngad. Manaati genoomi komplekti kontingend N50 oli 37, 8 kb, karkassi N50 suurus 14, 4 Mb ja kvaliteedinäitajad olid võrreldavad teiste Illumina genoomi koostudega.

Märkused.

Kasutati NCBI eukarüootse genoomi annoteerimise gaasijuhet. Esimene samm hõlmas tuvastamist ja maskeerimist WindowMasker 25 abil . Teiseks, valgud, RNA järjestamiskatsetest genereeritud transkriptid ja EST-d, kaasa arvatud RefSeq 26 uuringuorganismide või lähedalt seotud organismide varem tuvastatud järjestused, joondati BLAST-i abil genoomi komplekti. See samm hõlmas „poleerimise” etappi, kasutades vürtsikohtade teadlikku algoritmi Splign 27, et parandada teavet splaissikohtade ja eksonipiiride kohta. Valkude ja transkriptsioonide vastavusse viimine anti Gnomoni, kes kasutab varjatud Markovi mudeli (HMM) tööriista, mis põhineb Genscan 28-l, et laiendada ennustusi, mis puuduvad algus- või stoppkoodonist või sisemisest eksonist. Gnomon loob lisaks ab initio geenide prognoosid piirkondadele, millel puuduvad joondamise jooned. Viimane annoteeritud omaduste komplekt sisaldas eelistuse järjekorras (i) RefSeq ärakirju või genoomseid järjestusi ja (ii) Gnomoni ennustatud mudeleid. Iga genoomi maskeeriti täiendavalt korduvate elementide jaoks, kasutades RepeatMaskerit. Nende moodustavate korduvate elementide osakaal on näidatud lisajoonisel 3.

Ortoloogide identifitseerimine ja joondamine.

Viimane inimene (hg19), makaak (rheMac2), marmoset (calJac3), hiir (mm9), rott (rn4), alpaka (vicPac2), lehm (bosTau7), koer (canFam2), elevant (loxAfr3), paavian (papAnu2) ) ja opossum (monDom5; kasutatud outgroup-na) genoomi komplektid saadi UCSC genoomibrauserist. Inimese viidatud kogu genoomi joondused konstrueeriti sünteetilistest paarissuunitlustest inimese ('sünteetilised võrgud') või vastastikustest parimatest joondamistest inimesega, sõltuvalt montaaži kvaliteedist, UCSC MULTIZ joondamise torujuhtme 29, 30 abil .

Alustav geenikomplekt koosnes inimese RefSeq, UCSC Known Genes 31 ja VEGA 32 annotatsioonidest (alla laaditud UCSC-st 29. juulil 2013). Ära jäeti transkriptid, millel puudusid annoteeritud kodeerimispiirkonnad (CDS), mille CDS oli <100 aluspaari pikkune või mille CDS-id ei olnud kolmekordsed. Need koopiad rühmitati üheahelaliste CDS-ide järgi geenideks kattuvaks (transkripti klastriteks). Kõik transkriptid kaardistati sünteetiliste joondamise teel inimeselt teiste imetajaliikide külge ja seejärel viidi läbi filtrite seeria, mis oli kavandatud annoteerimisvigade, järjestuse kvaliteedi ja geenistruktuuri muutuste mõju minimeerimiseks järgnevates analüüsides. Lühidalt, iga inimese ärakiri oli vajalik (i) mitte-inimese genoomi kaardistamiseks järjestuse joondamise ühe ahela kaudu, mis sisaldab ≥80% selle CDS-ist; ii) pärast kaardistamist mõnele liigile, mis ei ole inimliik, omada ≤10% selle CDS-ist järjestuslünkadena või madala kvaliteediga järjestuses; iii) puuduvad kaadrivahetuse indelid, kui neid ei hüvitata 15 baasi ulatuses; ja (iv) puuduvad kaadrisisesed stoppkoodonid ja kõik splaissimiskohad on konserveeritud. Geenide jaoks, mis olid enamasti konserveerunud, kuid mille algus- või stoppkoodonid olid nihkunud, kaaluti ka mittetäielikke ärakirju, milles CD 10% alustest olid eemaldatud nende CDS-ide 5'- ja 3'-otsast. Lõplik ortoloogikomplektide kollektsioon saadi, valides iga geeni jaoks (täieliku või mittetäieliku) ärakirja, mis kaardistas edukalt suurima arvu mereimetajaid, teisese kriteeriumina kasutati ka teisi liike. Liiga korral valiti CDS-i kogupikkusega koopia. Selle protseduuri tulemusel annoteeriti 16 878 geeni vähemalt 2 inimesest erineva ortoloogiga, kusjuures iga geen oli keskmiselt ∼ 3, 3 mereliiki ja 4, 8 muud liiki (sealhulgas inimene).

Testimine positiivse valiku jaoks.

Positiivse valiku korral geenide leidmiseks rakendasime nelja erinevat hargnemiskoha tõenäosussuhte testi 33 : vaalaliste klade ja vaalaliste juurde viiva haru puhul rooska sugupuu, manatee sugupuu ja ühe katse kõigi nelja mereimetajaga seotud haru (esiplaan) üksikute testide harud on esile toodud joonisel 1). Kõigis testides kasutasime Kosioli et al . 34 . P väärtused hinnati eeldusel, et nulljaotus moodustab 50:50 segu distribution 2 jaotusest ja punktmassist nullil, mille tulemuseks on konservatiivsed P- väärtuse hinnangud 35 . Korduvtestide korrigeerimiseks kasutati Benjamini-Hochbergi meetodit 36 ja vale avastamismäära (FDR) piirväärtus oli 0, 1. Uuringu kõigi geenide terviklik tabel koos nende liikide loeteluga, kus leiti ortoloogid, ja teave selle kohta, milliste testide jaoks neid ortoloogirühmi kasutati, ja saadud P väärtused ning andmed selle kohta, kas nendel geenidel olid pärast F-väärtuse korrigeerimist olulised FDR-i väärtused allalaadimiseks on saadaval mitu testimist (vt URL-e). Geenid, mis on positiivse valiku korral arenenud, on loetletud lisatabelites 3, 9, 10 ja 11.

Geeni ontoloogia (GO) kategooriad määrati ortoloogsetele rühmadele vastavalt inimese genoomi viitele. Iga geen määrati ontoloogias ka kõigile vanemate kategooriatele. Kasutasime kahte erinevat statistilist testi, et tuvastada positiivselt valitud geenide üleesindatusega kategooriaid. Esiteks mõõdeti Fisheri täpse testiga (võttes arvesse kõiki geene, mille P <0, 05 oli positiivselt valitud), konkreetse positiivse valitud geenide kategooria rikastamist (täiendav tabel 12). Selle testi puuduseks on see, et selle tulemused sõltuvad suuresti positiivselt valitud geenide piirväärtusest. Teiseks kasutati Mann-Whitney U teste, et mõõta nihkeid kõrgemate P väärtuste suunas konkreetses GO kategoorias (lisatabel 13). Seega ei sõltu Mann-Whitney U test P- väärtuse piirväärtusest; kuid selle tulemusi võib positiivse valiku asemel mõjutada ka piirangute leevendamine. Mitme testimise korrigeerimiseks kasutati Holmi meetodit 37 .

Genoomilise lähenemise testimine.

Esivanemate järjestuste rekonstrueerimine viidi läbi 16 833 imetaja ortoloogil, kasutades Codeml programmi PAMLv4.4 (viide 38). Kõigi kolme mereimetajate rühma - vaalaliste, manaati ja mädarõika - osas võrreldi igas positsioonis olevaid järjestusi viimases esivanemale vastava sõlme esivanemate järjestusega. Kahe vaalaliste jaoks oli see sõlm lehmaga jagatud; kährikute jaoks oli see sõlm koeraga jagatud; ja lamanti jaoks oli see sõlm elevandiga jagatud. Esivanemate sõlmed on need, mis asuvad punaste harude juurtes joonisel 1. Me tuvastasime aminohapete positsioonid, mille puhul järeldati, et muutused toimusid, ja uurisime täiendavalt neid positsioone, mis muutusid enam kui ühes mereimetajate rühmas. Neid muudatusi oleks võinud jagada kõik kolm rühma või kõik kolm rühma. Muutused klassifitseeriti täiendavalt „paralleelseteks”, kui nende tulemuseks oli tänapäevastes liikides identne aminohapete olek, ja „tavalisteks”, kui nende tulemuseks olid tänapäevastes liikides mitte identsed aminohappelised olekud. Hüpoteesiti, et ühised muutused on võimalikud ühinenud evolutsiooni indikaatorid, kui veeeluga kohanemist saab läbi viia mitme erineva aminohappe kaudu samas asendis. Seejärel võrreldi tavaliste ja paralleelsete muutustega geene positiivse selektsiooni all olevate geenidega ja nende kahe komplekti vahel kattuvate geenide kohta järeldati, et need on ühtlustunud. Positiivselt valitud geenides leitud paralleelsete mittesünonüümsete aminohappeasenduste positsioonid on toodud täiendavas tabelis 14.

URL-id.

Mitme genoomi joondamise, ortoloogide komplekti ja tõenäosussuhte testi tulemused, //compbio.fmph.uniba.sk/suppl/marine-mammals/; NCBI eukarüootide genoomi annoteerimise juhe, //www.ncbi.nlm.nih.gov/genome/annotation_euk/process/; UCSC genoomibrauser, //genome.ucsc.edu/; Baylori meditsiinikolledži mereimetajate genoomi projekt, //www.hgsc.bcm.edu/marine-mammals; Atlas-Link, //www.hgsc.bcm.edu/software/Atlas-Link; ATLAS GapFill, //www.hgsc.bcm.edu/software/atlas-gapfill; Gnomon, //www.ncbi.nlm.nih.gov/genome/guide/gnomon.shtml; RepeatMasker, //www.repeatmasker.org/.

Pöörduskoodid.

Terve genoomi haavlipüsside järjestused on deponeeritud GenBankis BioProjekti juhendite ANOL00000000, ANOP00000000, AHIN00000000 ja ABRN00000000 all. Järjestuse määramise andmed on hoiustatud GenBankis BioProject 170427 all, mis vastab mereimetajate genoomide projektile. Florida manaatide genoomi järjestusandmed on hoiustatud GenBankis BioProject PRJNA189960 all.

Liitumised

Esmased liitumised

BioProjekt

  • 170427
  • ABRN00000000
  • AHIN00000000
  • ANOL00000000
  • ANOP00000000
  • PRJNA189960

Integreeritud lisateave

Täiendavad arvnäitajad

  1. 1

    Glutatiooni rada (KEGG raja kaart 00480).

  2. 2

    Kõigi 14 fülogeneesia liigi paarisvõrdluste võrdlevate asenduste protsent.

  3. 3

    RepeatMaskeri tuvastatud genoomifraktsioonide tabelid.

Täiendav teave

PDF-failid

  1. 1

    Täiendav tekst ja arvud

    Täiendavad joonised 1–3 ja lisatabelid 1, 2, 4–6, 8 ja 14.

Exceli failid

  1. 1

    Lisalaud 3

    Geenid, mida identifitseeriti positiivse valiku korral arenevana mereimetajate kombineeritud harus.

  2. 2

    Lisalaud 7

    Positiivselt valitud geenid, mis sisaldavad identseid või 'tavalisi' aminohappeasendusi ühes ja samas jäägis kõigis kolmes mereimetajate liinis.

  3. 3

    Lisalaud 9

    Geenid, mis on arenenud vaalaliste harus positiivse valiku korral.

  4. 4

    Lisalaud 10

    Geenid, mis tuvastati arenevana positiivse valiku korral sireeni (manatee) harus.

  5. 5

    Lisalaud 11

    Geenid, mida peetakse positiivse selektiivsuse korral arenevaks piki varbalülist.

  6. 6

    Lisalaud 12

    Positiivselt valitud geenide funktsionaalse rikastamise analüüs piki mereimetajate kombineeritud haru.

  7. 7

    Lisalaud 13

    Märkimisväärsed muutused geeni ontoloogia kategooriates piki mereimetajate kombineeritud haru.