perjantai 17. marraskuuta 2017

Introductory Globetrotter analysis

Globetrotter is a new software being able to estimate admixtures and also admixture dates. The analysis itself is based on autosomal haplotype data, which is produced by the software Chromopainter, version 2.  My job queue was Plink, Shapeit, CromopainterV2 and Globetrotter.   The Plink format data consisted of 399000 SNPs and 254 individuals over the Eurasian continent.  I liked to have more individuals, but I can use only publicly available data and it is always my restriction.

In the first phase I made a phylogenetic tree using softwares Chromopainter and Finestructure.  Chromopainter was run in two phases, at first to define necessary run parameters and in the second phase generating a tree figure and ancestral matrices.  In the next step individual samples were grouped according to the phylogenetic tree and the result was moved to the following Chromopainter runs preceding Globetrotter analysis.  So there was no handmade grouping and all definitions were done by softwares.

Results:



Admixtures

The deep past can't be figured correctly by present day populations.  Names like Finnish, Polish and Eastern_Baltic_Finnic didn't exist thousands years ago and all group names should be understood representing something now unknown.  Another imperfection is that some populations are unmixed.   For example Balts and Basques cannot be defined by any other present day populations, with exception of themselves, which is not clever at all if we want to see ancient migrations.   In those cases there are sure unknown ancient admixtures without present day proxies and for example Balts are figured as East Slavs.

Finns

Khanty_Mansi    0.00669230541442569
Saami    0.0318001424720861
Scandinavian    0.0406288973530398
Eastern_Baltic_Finnic    0.372195068297064
South_Baltic_Finnic    0.547727866737746


Saami

Basque    0.00627519770432461
West_Europe    0.0203347268787166
Mongola    0.0285387511835476
Nganasan    0.0312587449978488
Irish_Scottish    0.0348178173049934
West_Siberia    0.0372717151545831
Khanty_Mansi    0.058915141944102
Eastern_Volga_Finnic_Chuvash    0.108026814008228
Eastern_Baltic_Finnic    0.120473106582914
Finnish    0.554087984240742


Irish

Basque    0.0168485068643567
Southwest_European    0.085582697894791
West_Europe    0.897568795240852


Tatar

Saami    0.00341643675195708
Nganasan    0.00501267346037914
RushanVanch_Tajikistan    0.00854395216066372
West_Siberia    0.0142527316035022
Irish_Scottish    0.0232322099579794
South_Baltic_Finnic    0.0375544108580537
Baltic    0.0616973387576695
Mongola    0.102871971437878
East_Slavic    0.119214847082816
South_European    0.12153228301688
Eastern_Volga_Finnic_Chuvash    0.184584853664197
Western_Volga_Finnic    0.317983363220266


Khanty-Mansi


RushanVanch_Tajikistan    0.00496570412383918
Western_Volga_Finnic    0.00973524498071095
Saami    0.0209045306129885
Scandinavian    0.0314001203298436
Mongola    0.0468217500718522
West_Europe    0.0512201282635752
Eastern_Volga_Finnic_Chuvash    0.322872736453914
West_Siberia    0.510808280436572


Scandinavian

Baltic    0.0039132358786016
Saami    0.0040658994834093
South_Baltic_Finnic    0.331326055831535
West_Europe    0.660694808806454


Western Volga-Finnic

West_Siberia    0.001211877430627
Basque    0.00153548108955792
Mongola    0.00217721497484364
Irish_Scottish    0.00441065912271718
Nganasan    0.00489486172279255
Saami    0.00654435392074552
South_Baltic_Finnic    0.00873613821602628
Khanty_Mansi    0.011149101703621
Eastern_Volga_Finnic_Chuvash    0.0443170163661487
Tatar    0.170123511582196
East_Slavic    0.744899783870725


Baltic

Saami    0.00434883756492699
East_Slavic    0.995651162435073


East Slavs

Western_Volga_Finnic    0.0180131830693537
Mediterranean-East    0.0941857330298036
Central_Europe    0.170383068761459
Baltic    0.717418015139384


Basque

Southwest_European 1


South Baltic-Finnic
  
Saami    0.0015403209540466
Basque    0.00277573750507665
Irish_Scottish    0.00668755305870894
Southwest_European    0.0131644799855559
Eastern_Volga_Finnic_Chuvash    0.0132143162745874
Eastern_Baltic_Finnic    0.0231748074310308
East_Slavic    0.152341012943326
Baltic    0.168097194491377
Scandinavian    0.203236330851964
Finnish    0.415614563156978


East Baltic-Finnic

Nganasan    0.00749839275609302
Khanty_Mansi    0.0101318772456883
Saami    0.0189334364744419
Eastern_Volga_Finnic_Chuvash    0.0341857812007321
Western_Volga_Finnic    0.0445466151938662
Baltic    0.259991450633669
Finnish    0.624712446495509




Finnish admixture dates and proportions.  

date in generations:  69.2367424689291

admixtures:


Khanty_Mansi 0,0290405745
Nganasan 0,0343370651
Saami 0,0360340021
Russian_Pinega 0,0402546721
South_Baltic_Finnic 0,8603336861

The software inferring admixture dates is quite sophisticated and I am still learning how to use it.   Before knowing more about it  I can't comment previous results, they are "as is".   







8 kommenttia:

  1. Mistä muusta kuin siitä, että sopivat viiteryhmät puuttuvat, voisi johtua se, että saamelaiset saavat paljon enemmän väestölähteitä kuin suomalaiset?

    Saisiko noita tekstejä mitenkään näkymään paremmin.
    Vaikka kuinka yritän, ei näkö riitä.

    VastaaPoista
    Vastaukset
    1. Tässä linkki tarkempaan kuvaan. Tein tuon vain ryhmittelyn avuksi ja tarkoitus ole tehdä laajempi Globetrotter-analyysi, jonka julkaisin vain Muinainen Suomi foorumilla, koska halusin vielä testata. Fylogeneettiset puut autosomaalidatasta ovat alinta taso lukuunottamatta arvioita, eivät yksiselitteistä faktaa.

      http://www.elisanet.fi/mauri_my/a7chunklengths4SimpleFullDendrogram.pdf

      Poista
    2. Kiitos! Nyt alkoi näkyä.

      Huomaan, että saami ei saa yhtään Skandinaviaa vaan sen tilalla on baski, Länsi-Eurooppa ja skotti. Tulkitsin tämän niin, että kyseisen saamin Länsi-Eurooppa ei tule suoraan skandinaaveilta. Onko näin? Kyseessä on ilmeisesti taas kaikkein Siperia-pitoisin pohjoissaamelainen.

      Poista
    3. Syy saamen länsieurooppalaiseen sekoitukseen voi johtua skandinaavien suomalaisesta perimästä. Nykysaameilla on 67% yhteistä perimää suomalaisten kanssa ja skandinaaveilla 33% yhteistä eteläistä itämerensuomea, niin pohjoissaamien mahdollinen pieni skandinaaviaperimä sulautuu osin tähän suomalaisosuuteen ja ei-suomalainen skandinaaviosuus päätyy länsieurooppalaiseksi. Asioita on aina ikävä selitellä, enkä ole koskaan kuullutkaan selitystä miksi minulle tulee kaupallisia testeissä 5-8%:n osuus albaaniaa, kreikkaa ja italiaa, tai 40-50% saksaa tai englantia :) Sekoituslaskurit eivät vain osaa yhdistää oikein referenssejä ja niiden summittaisia välimuotoja. Itse pyrin huomioimaan vain isoja linjoja ja niiden merkityksiä, esimerkiksi sen että suomalaisten volgansuomalaisen perimän puuttuminen ei voi johtua pelkästään suomalaisten ajautumasta, koska samoilla testeillä näkyy selvä skandinaaviyhteys.

      Poista
    4. Vilkaisin äsken uudestaan tuota puudiagrammia ja kiinnitin huomiota siihen, että uralilaisten kielten jaottelu ei mene ollenkaan tuon puudiagrammin mukaisesti:
      Samojedikieliä puhuvat nenetsit ja nganasanit eivät mene samaan klusteriin, joten niillä on eri geenihistoria. Muut itäuralilaiset nganasaneja lukuun ottamatta ovat samassa klusterissa Mongolan kanssa, mutta nganasanit ovat evenkien ja evenien kanssa. Länsiuralin puhujat jakautuvat kolmeen klusteriin siten, että suomalaiset, vepsäläiset ja karjalaiset ja joku virolainen on samassa klusterissa. Saamelaiset, joiden kielen usein katsotaan kuuluvan yhteen itämerensuomalaisten kielten kanssa, ovat eri klusterissa udmurttien, marien, tsuvassien ja tataarien kanssa. Komien ja udmurttien kielet ovat verraten läheisiä, mutta geneettisesti he ovat kaukana toisistaan ja vielä niin, että pohjoisempana asuvat komit, eikä udmurtit, muistuttavat itäslaaveja enemmän. Suurin osa virolaisista menee samaan klusteriin mordvien ja komien kanssa ja tässä klusterissa ovat myös itäslaavit.

      Missä lienee kantauralin puhujien geneettinen ydin… Toisaalta en oikeastaan enää usko siihen, että juuri mikään isälinja olisi puhunut yli 5000 vuotta sitten nykyään samaan kieliryhmään luokiteltavaa kieltä ja äitilinjathan eivät noudata mitään kielijakoja.

      Poista
    5. Puun rakenteeseen vaikuttavat monet asiat, mm. väestöjen näytteiden määrät suhteessa keskenään, ohjaako rakenteen muodostumista samanlaisuus vai erilaisuus, ts. sekoitussuhteiden koko. Tein tämän jälkeen uuden kuvan, jossa on enemmän suomalaisia. Siinä suomalaiset eriytyvät voimakkaammin ja kaikki virolaiset siirtyvät balttihaaraan. Autosomaaliperimää on mahdoton kuvat puurakenteella, koska se muodostaa verkkorakenteen. Lisäksi tulokseen vaikuttaa ajautuma ja pullonkaulailmiöt, joita yritetään ohjelmallisesti ratkoa esimerkiksi Globetrotterissa, mutta tämä puu on tehty Finestruktirella, joka ei ymmärrä näitä ilmiöitä datan sisällä, ts. niiden vaihtelua väestöissä. Tämän guoksi väestöryhmien valinta on aina paras arvaus.

      Poista
  2. The Balts are not Eastern Slavs. Would you like to know what you call Slavic?

    VastaaPoista
    Vastaukset
    1. If you look at the dendrogram I linked in my answer to Kristiina you see that Balts and Slavs are side by side, but in two different branches. The grouping however doesn't follow today's linguistic boundaries. Some Belarussians and Russian from Pskov are located among Balts, as well as some Estonians. Globetrotter shows only Slavic ancestry for Balts (and a small amount Estonian Saami because almost all Estonians are classified Baltic) for the reason that the Balts are genetically a very distinct group and the Slavs are their closest "cousins". They must have common and very old ancestry. Figuring the difference using Balts only would need ancient samples. The grouping is not linguistic. In commercial tests Slavs and Balts are usually grouped into one group "East Europeans", but my test see the difference showing Slavic admixtures:

      East Slavs

      Western_Volga_Finnic 0.0180131830693537
      Mediterranean-East 0.0941857330298036
      Central_Europe 0.170383068761459
      Baltic 0.717418015139384

      We see that the Slavs and Balts differ and East Slavs have Central European and East Mediterranean admixtures, plus a small Volga-Finnic trace. The Balts lack of all admixtures.

      Poista

English preferred, because readers are international.

No more Anonymous posts. Do not act like folks on poorly moderated forums.