Autoclustering

Met 4432 matches op MyHeritage zijn er potentieel veel aan mij gelieerde personen, maar warschijnlijk ook veel foute detecties. Hoe kunnen we in deze grote hoeveelheid personen wat orde scheppen.

In de eerdere post beschreef ik de mogelijkheid om getrianguleerde detecties te vinden. Het vinden van deze personen is handwerk: selecteer de persoon en kijk met wie deze getrianguleerd zijn.

En deze ontdekkingen kunnen dan in een mooie cluster grafiek gezet worden:

DNAkwartierstaatClusters

Ter herinnering de horizontale as geeft de DN-matches weer gegroepeerd op gezamelijke voorouder(s) en dit in volgorde van Ahnentafel getallen. Links dus de paternale lijn en rechts de maternale lijn. Verticaal zijn personen gegroepeerd op gezamelijk DNA en zo in volgorde gezet dat alle clusters op een diagonale lijn terechtkomen.

MyHeritage geeft de mogelijkheid om een vergelijkbare grafiek automatisch te creeren met behulp van de methode van autoclustering. Hierbij wordt gekeken naar overeenkomstige DNA en als er voldoende overeenkomsten zijn, worden deze personen gegroepeerd. De personen komen op de horizontale as en vertikale as te staan. 

Autoclusters

Bovenstaande grafiek geeft het resultaat van MyHeritage autoclustering. Elke blokje geeft een groepje bij elkaar horende personen. De volgorde van de clusters langs horizontale en vertikale is zo gekozen dat alle clusters of een diagonale lijn liggen.

In mijn clustergrafiek zijn 8 relevante clusters te herkennen. Als het goed is komen deze ook terug in de autoclustergrafiek, mar er zijn maar 7 clusters gevonden. Deze heb ik dezelfde kleur gegeven. De autocluster aanpak heeft 15 extra clusters gevonden.

Gemaakt en onderhouden door Arnaud Leene (2002 - 2022)