Viktiga uppdateringar och förbättringar av DNA-matchningar på MyHeritage

Viktiga uppdateringar och förbättringar av DNA-matchningar på MyHeritage

Vi är glada att meddela om stora uppdateringar och förbättringar av DNA-matchningar, nu tillgängliga för alla våra användare. Alla som har tagit ett MyHeritage DNA-test, och alla som har laddat upp DNA-data från en annan tjänst, kommer nu att få mer exakta och rikligare DNA-matchningar (ca 10x mer); färre falska positiva matchningar, mer specifika och exakta förhållandeuppskattningar; och indikationer på mindre säkra DNA-matchningar för att bidra till att forskningsarbetet blir mer fokuserat. Vi har också lagt till den efterfrågade kromosomwebbläsaren, som beskrivs nedan.

Vårt vetenskapsteam har arbetat och utvecklat dessa förbättringar i flera månader. De tog lång tid och stora ansträngningar då vi ville göra vetenskapen perfekt och ge våra användare optimala resultat.

Vad innebär DNA-matchning?

MyHeritage DNA har för närvarande mer än en miljon människor i DNA-databasen. 1,075 miljoner för att vara exakt.
DNA-matchnhingen jämför DNA-kit i MyHeritage-databasen med varandra, för att hitta släktingar, det vill säga individer som delar DNA-segment med varandra och förklarar hur dessa personer är relaterade. Delade DNA-segment mellan två personer kan indikera ett blodförhållande, vilket innebär att de delade segmenten har ärvts från gemensamma anfäder. Om de delade segmenten är många och stora är ett blodsförhållande säkrare. Å andra sidan, om de delade segmenten är små i antal och storlek, kan det också vara en slumpmässig fråga, och indikerar inte något blodförhållande alls. När en matchning rapporteras som inte är en släkting alls, är det en falsk positiv matchning.

Om du har tagit ett MyHeritage-DNA-test och fått resultaten, eller om du har laddat upp dina DNA-data till MyHeritage, så har du fått en lista över dina DNA-matchningar. Matchningarna uppdateras dagligen och användarna meddelas varje vecka om de bästa nya matchningarna som de har fått samma vecka. Med ”bästa” menar vi matchningar som har den största mängden delat DNA som indikerar ett närmare förhållande. Listan över DNA-matchningar visar individer som delar DNA-segment med dig, mängden och andelen DNA som ni delar, antalet DNA-segment ni delar och storleken på det största delade segmentet. MyHeritage uppskattar också förhållandet genom att analysera antalet och storleken på de delade DNA-segmenten hos varje matchning och jämför dem med en referenspool av hundratusentals andra matchningar, med kända relationer enligt familjeträd som har bekräftats av DNA. DNA Match Review Page erbjuder matchningar som du kan följa upp för att spåra en släkting till dina förfäder.

Från och med nu kommer användare som redan har fått DNA-matchningar, att se andra och bättre matchningar, efter dessa förbättringar. Det betyder att många nya matchningar kommer att visas. Vissa matchningar som fanns innan, som var falska positiva, kommer att försvinna. Många matchningar kommer att ändra sina parametrar (t ex mängd delat DNA) till mer exakta värden. Användare som inte har fått matchningar än, kommer att få matchningar med högre kvalitet från dag ett.

 

Hur fungerar DNA-matchning?

Schematisk representation av kedjan som producerar DNA-matchningar.

Schematisk representation av kedjan som producerar DNA-matchningar.

Låt oss börja med en snabb överblick över hur DNA-matchning fungerar. Därefter dyker vi in ​​i de förbättringar vi har gjort i de olika stadierna av processen.

Processen börjar när du tar ett DNA-test och skickar ditt prov till vårt labb. I labbet läser vi ditt DNA och producerar en datafil med informationen. Vi läser inte alla delar av ditt DNA, vilka uppgår till cirka 3 miljarder punkter. Detta är en dyr metod som kallas hel-sekvensering av arvsmassa, för närvarande reserverad för specifika kliniska och forskningsapplikationer. I stället fokuserar vi på att läsa av cirka 700 000 punkter i ditt DNA som är kända att variera mellan individer, och kallas enkla nukleotidpolymorfismer (SNPs, uttalade ”snips”). Denna metod kallas genotypning och den producerar en datafil som listar varje SNP som vi läser, dess position i ditt DNA och de två genotyperna vi hittade där (dvs A, T, G eller C du ärvde från varje förälder). Om du laddar upp DNA-data från en annan tjänst, tar vi emot datafilen med samma information.

Därefter använder vi imputation för att avleda SNP:erna som vi inte läste. Tänk på att imputera DNA, som att läsa en mening där några av bokstäverna saknas – det finns en god chans att du kan härleda de saknade bokstäverna från sammanhanget. Inte alla DNA-tjänsteleverantörer läser samma SNP. För att hitta DNA-matchningar för individer som använde olika DNA-tjänsteleverantörer är det viktigt att utgå från de SNP som inte lästes innan man jämförde resultaten. Vissa människor ifrågasätter riktigheten av imputation. Vi fann emellertid att denna metod är mycket korrekt när den används ordentligt, och i vissa situationer är användningen oundviklig.

Efter imputationen kommer fasning. I varje par kromosomer får varje person en kromosom från sin mor och en från sin far. Genotyptekniken som läser ditt DNA-prov bestämmer vilka genotyper du har ärvt från dina föräldrar, för varje SNP, men det berättar inte för oss vilka grupper av varianter som är nedärvda från samma förälder. Fasning hjälper oss att sortera ut det här. Det sammanställer alla varianter som är ärvda från en av dina föräldrar i en grupp och varianterna ärvda från den andra föräldern i en annan grupp.

Nästa steg är att utföra den faktiska matchningen och att jämföra alla DNA-kits i databasen, som inte har valts ut för att matcha sina ägare med varandra. Vi gör detta med ett system av skalor, som heter Hadoop, som gör att vi kan utföra massiv distribuerad bearbetning mycket effektivt. Matchning identifierar de gemensamma segmenten mellan varje uppsättningspar, varifrån förhållandet mellan de två individerna (om någon) kan härledas. Angränsande gemensamma segment är då ”ihopsydda” om de anses vara angränsande.

Slutligen använder vi avancerade statistiska algoritmer som kallas klassifikatorer, för att granska DNA-matchningarna och avvisa falska positiva, för att bestämma säkerhetssnivåerna för de matchningar som inte avvisades och föreslå typen av förhållande för varje matchning. Så skapar vi din lista med DNA-matchningar.

Hur har vi förbättrat DNA-matchningen?

Vi har förbättrat noggrannheten av vår imputation betydligt genom att öka antalet referensgenomerer mer än tiofaldigt. Precis som att läsa 10 gånger så många böcker skulle göra det möjligt för en person att exakt utfärda saknade bokstäver från flera meningar, ökade vår referensgenompanel kraftigt vår förmåga att ålägga SNP som vi inte läste, mer exakt.

Vi fixade fasningen. Den tidigare bearbetningen av DNA-matchningar hade tillfälliga fel i fasningssteget. Dessa fel orsakade några falska positiva värden, där vi tidigare uppskattade delade segment av mycket avlägsna släktingar. Det orsakade också problem där vi tidigare underskattade delade segment av nära släktingar. Vi använder nu en bättre algoritm som åtgärdar dessa fasfel.

I matchningsfasen har vi omkalibrerat tröskeln för genotypfel. Tekniken som läser av ditt DNA-prov gör enstaka misstag. Dessa kallas genotypfel. Om ett genotypfel inträffar mitt i det som ska vara ett delat segment mellan DNA-matchningar, ser det inte ut som att segmentet är identiskt och det kan delas upp i två matchande segment som är mindre. Vi kalibrerade tröskelvärdet för när vi ignorerar små felmatchningar mellan annars matchande segment, och behandlar de delade segmenten som identiska trots små bitar som inte matchar. Denna metod kompenserar för oundvikliga genotypfel. Om vi ​​ignorerar felaktiga sektioner som är för stora, antar vi av misstag att ett segment delas när det egentligen inte är delat. Om vi inte ignorerar felaktiga sektioner som är resultat av genotypfel, kommer vi sannolikt att sakna riktiga DNA-matchningar. Den nya kalibreringen är strängare än den föregående, vilket innebär att färre falska positioner kommer att glida igenom.

Mer avlägsna matchningar är nu tillåtna. Efter att ha ökat noggrannheten i matchningarna och kalibrerat ovanstående parametrar, kändes det tillräckligt säkert att mer avlägsna matchningar presenteras för dig. Tidigare var det minsta delade DNA för en matchning 12 cm och nu är minimum 8 cm. Detta tillsammans med de andra förbättringarna gav en tiofaldig ökning av antalet DNA-matchningar som våra användare nu kommer att få.

Dessa matchningar visas automatiskt för alla som redan har tagit ett MyHeritage DNA-test eller för de som redan har laddat upp sitt DNA till MyHeritage tidigare, och för alla som kommer att göra det i framtiden.

Bättre sammanfogning av intilliggande segment. Förutom att kompensera för genotypfel inom segmenten är det nödvändigt att kompensera för de återstående fasfel mellan segment. Till exempel, förutom könskromosomen förväntas en mamma och dotter ha 22 matchande segment i ett autosomalt DNA-test: En kromosom från var och en av dotterns kromosompar har ärvts av mamman, varför var och en av de 22 autosomala kromosomen verkar vara ett enda, långt matchande segment. På grund av fasfel kan ibland små delar av kromosomen som ärvs från modern beräknas bytas ut med de parallella sektionerna som ärvts från fadern. Detta är ett resultat av tekniska fel, inte biologiska processer. Vi har överkommit dessa fel genom att öka storleken på de luckor vi sammanfogar, medan vi kalibrerar detta exakt för att undvika att införa nya fel.

Det sista steget i DNA-matchningen filtrerar bort falska positiva och uppskattar det specifika förhållandet mellan två individer med gemensamma DNA-segment. Eftersom många av oss är ättlingar av samma mycket forntida förfäder, har vi ofta små gemensamma DNA-segment med individer som vi inte skulle överväga som familj. Vi sökte en metod för att filtrera bort sådana matchningar som bara frustrerar släktforskare. För detta ändamål mäter vi falska positiva inlägg genom att titta på trion – uppsättningar barn, mor och far som alla testades med MyHeritage DNA-kit och fick resultat som validerat att förhållandet mellan föräldrarna och barnet är korrekt. Alla matchningar som ett barn har med en annan individ, som inte matchar varken fadern eller modern, misstänks vara falsk positiva och kallas endast-barn-matchning. Vi mäter procentandelen av ensamstående matchningar bland alla matchningar som kommer upp för barn hos alla kända trion på MyHeritage, och den här siffran heter procenten av misstänkta falska positiva indikationer som anges av endast-barn-matchningar. Vi lyckades föra den här siffran till 16-20 procent, vilket är ett bra resultat som så vitt vi vet är likvärdigt med eller bättre än alla andra DNA-tjänster. Våra förbättrade klassificeringsalgoritmer har lyckats med att föra vår falska positiva uppskattning till den absolut lägsta hitills.

Men vi har inte stoppat där. Vi ville skapa en metod som låter dig fokusera på dina släktforskningssökningar på det mest effektiva sättet. Därför använde vi våra statistiska algoritmer för att kategorisera matchningar i hög, medium och låg säkerhet. Matchningar som är låga eller medium är märkta som sådana på webbplatsen. Dessa är DNA-matchningar som bör behandlas med skepsis eftersom de riskerar att vara falskt positiva. Sådana matchningar har vanligen mycket få och mycket små gemensamma DNA-segment. Dessa indikationer gör att du kan utnyttja din tid så mycket som möjligt. Följ först upp på matchningar med hög säkerhet, och om du är på humör för en utmaning, forska i mediummatchningar för att hitta gömda skatter. Observera att låga och mediummatchningar är uteslutna från de veckovisa meddelandena om nya matchningar.

Den nya uppdelningen är så bra att procentandelen av endast-barn-matchningar som inte är märkt som låg eller medium, är nu mindre än 5%. Med andra ord, när du granskar en DNA-matchningatch på MyHeritage som inte är markerad som låg eller medium, kan du nu vara nästan säker på att du inte slösar bort din tid på en falskt positiv. Om matchningen du granskar beräknas vara en syssling eller närmare, finns det så pass mycket gemensam DNA, att du kan vara säker på är det inte en falskt positiv matchning.

Noggrannheten för att uppskatta en relation hos en DNA-matchning mäts med två parametrar som kallas återkallelse och precision. Perfekt noggrannhet innebär både att en användare berättar om rätt förhållande till en DNA-matchning, varje gång (återkallelse), samtidigt som man föreslår det förhållandet och inte föreslår ett större antal möjliga relationer (precision). Till exempel, om två individer faktiskt är syskon, kommer en perfekt algoritm att föreslå att de är syskon och bara att de är syskon. Det kommer inte att uppskatta att de är antingen syskon eller kusiner. (Biologiskt, på grund av DNA-arvets natur är denna teoretiska perfekta algoritm inte möjlig). MyHeritage kan nu föreslå rätt förhållande på DNA-matchningar 93% av alla gånger, för avlägsna släktingar som kusiner i 4:e och 5:e led, vilket är otroligt svårt att göra. För närstående är precisionen mycket högre och ligger nära 100%. Samtidigt föreslår vi bara 2 eller 3 möjliga relationer för DNA-matchningar som är 1:a kusiner eller närmare. För avlägsna kusiner kommer vi att visa ett genomsnitt på upp till 5 möjliga relationer (som syssling eller brylling) – ett relativt smalt intervall. Precisionen och återkallelsen av MyHeritage förhållningssätt är nu mycket bättre än tidigare.

Vi validerade den höga kvaliteten på vår nya DNA-matchande algoritm genom att jämföra nya DNA-matchlistor till de som produceras av andra DNA-företag och resultaten är mycket lika.

Vissa särskilt endogamiska populationer, som Ashkenazi-judar, utgör en unik DNA-matchande utmaning. Eftersom dessa populationer upplevde betydande blandäktenskap har icke-genealogrelaterade individer inom dessa populationer delat mer DNA än vad som förväntas för icke-släktingar annars. MyHeritage utvecklade ytterligare en klassificeringsalgoritm med maskininlärning för att klassificera Ashkenazi-relationer med högre upplösning än någon annan DNA-tjänst. Vi använde denna uppdelning för att bättre avvisa falskt positiva matchningar för Ashkenazi-judar, vilket ger dem samma nivå av falskt positiva som den allmänna befolkningen.

Vad betyder dessa förbättringar för MyHeritage-användare?

Nu, kommer du att få:

  • Mer precisa DNA-matchningar
  • Ungefär 10 gånger fler DNA-matchningar
  • Mer specifika och mer exakta relationsuppskattningar
  • Indikation om nivån på säkerheten hos DNA-matchningen så att du bättre kan fokusera din forskning

Kromosomwebbläsare

Tillsammans med förbättringar i noggrannhet, har vi också lagt till nya funktioner för att förbättra användningen av DNA-matchningar. Den första är, efter stor efterfrågan, en kromosomwebbläsare för gemensamma DNA-matchningar. Den finns på DNA Match Review-sidan.

En kromosomläsare är en schematisk representation av en persons kromosomer där DNA-segment kan visualiseras. Många av våra användare har begärt en kromosomwebbläsare och vi vet att detta är ett viktigt verktyg för släktforskare. Därför lovade vi att vi skulle utveckla en och nu har vi levererat löftet. Den nya kromosomwebbläsaren på MyHeritage är en första utgåva, som snart kommer att förbättras ytterligare. Den är avsedd för visning av gemensamma DNA-segment för varje DNA-matchning. Det är en fri funktion som kan användas av alla användare på MyHeritage som har tagit DNA-testet eller laddat upp DNA-data. Det visar de gemensamma segmenten mellan dig och en DNA-matchning, i lila. När du håller muspekaren över något gemensamt segment kan du se det gemensamma segmentets genomiska position, segmentets storlek och antalet SNP:er. Grå-segmenten delas inte med DNA-matchningen och korsade sektioner har inte analyserats på grund av bristen på SNP i dessa regioner. Observera att vi aldrig någonsin skulle tillåta en annan användare att ladda ner din råa DNA-data, men om en annan användare har ett gemensamt segment med dig, kan hen se dess detaljer (position och storlek), genom att granska segmentets information om sitt eget DNA, och den andra användaren kan härleda de genotyper som du har i ditt DNA i det specifika segmentet. Användare som föredrar att förhindra andra användare som matchar deras DNA att se detaljerna i gemensamma segment, kan välja bort den här funktionen genom att använda en ny integritetsinställning som vi har lagt till, för detta ändamål.

Kromosomwebbläsaren innehåller också möjligheten att ladda ner data om gemensamma segment. Detta är tillgängligt via menyn ”Avancerade alternativ” längst upp till höger i kromosomwebbläsaren. Avancerade användare kan använda det här alternativet för att ladda ner informationen om de gemensamma segmenten och sedan använda den för visning i andra verktyg eller kromosomwebbläsare. Fler funktioner kommer snart att finnas, till exempel möjligheten att visa tre eller flera DNA-matchningar med gemensamma segment samtidigt. Att se de gemensamma segmenten hos flera DNA-matchningar samtidigt, hjälper dig att spåra och identifiera de gemensamma förfäder som delar segmenten i DNA-matchningarna och sedan upptäcka hur ni är relaterade till varandra. Vi planerar också att lägga till möjligheten att snabbt skriva ut de gemensamma segmenten som kromosomwebbläsarenvisar.

Med viss övning är vi övertygade om att våra användare kommer att kunna använda den nya funktionen och börja identifiera specifika segment i sina DNA och förfäderna som de härrör från, få bättre insikter om sina DNA-matchningar och bättre förstå relationer som kommer från dessa DNA-matchningar. Vi hoppas att detta kommer att hjälpa vårt samhälle att `bryta igenom tegelmurar`, spåra deras anor och förstå hur de är relaterade till familjemedlemmar som upptäckts via DNA-matchningarna.

Ansiktslyftning och enklare navigering
Som en del av denna uppdatering gjordes små ändringar av DNA-matchningarnas användargränssnitt för bättre överensstämmelse med de andra DNA-skärmarna. De flesta av dessa förändringar är små och knappt märkbara, till exempel knappar på listan över DNA-matchningar är lila istället för orange. En ytterligare meningsfull förbättring är att DNA-matchningslistan nu innehåller detaljerna i DNA-kittet som du ser överst, så när du rullar igenom listan kommer du aldrig att förlora spår på vilka matchningar du tittar på.

Pågående arbete

Vårt arbete är inte fullständigt. DNA-matchning är alltid på gång och kommer ständigt att förbättras av oss i framtiden. Den växande storleken på vår DNA-databas, liksom den ökade kopplingen mellan DNA-kit och familjeträd, ger oss fler möjligheter att optimera DNA-matchningsalgoritmerna, och vi avser att göra det regelbundet och förbättra noggrannheten ytterligare.

När det gäller DNA-data som laddas upp från andra tjänster stöder vi fortfarande inte DNA som matchar DNA-kit som bygger på Illumina GSA-chipet. Dessa inkluderar kit från 23andMe (senaste V5-versionen) och Living DNA. Vi har stöd för DNA-data från GSA-chips som arbetar i vårt lab; Det är i bra form, men ändå inte perfekt, så vi bestämde oss för att utesluta det från denna release tills det är perfekt. Detta kommer att läggas till under de närmaste månaderna.

Etnicitetsuppskattningar är separata från DNA-matchning och de förbättringar som beskrivs här påverkar inte etnicitetsuppskattningar. Vi planerar en uppdatering till våra etnicitetsrapporter de närmaste månaderna, för att förbättra även deras noggrannhet. Håll dig uppdaterad!

Nästa steg

Beställ ett MyHeritage DNA-kit för att dra nytta av dessa nya funktioner och förbättringar, om du inte redan har gjort det. Om du redan har testat dig själv, överväg att skaffa DNA-kits för några av dina släktingar, särskilt de äldre, hitta fler släktingar och triangulera dina egna matchningar. Till exempel, genom att testa en kusin till din mamma eller pappa, kommer alla matchningar med nya släktingar som du redan har som delas med den kusinen, att trianguleras till en gemensam förfader, genom en väg till en nyare förfader i ditt släktträd som du delar med den kusinen. Den nya kromosomwebbläsaren kommer att vara till nytta för att förstå dessa matchningar. Så om det finns en viss gren i ditt släktträd som du är mer intresserad av att utforska vidare, köp ytterligare DNA-kits för äldre släktingar i den grenen.

Om du redan testat ditt DNA på annat håll, ladda upp din DNA-data till MyHeritage. MyHeritage är den enda av de tre största DNA-tjänsterna som stödjer uppladdning av DNA-data. Dra nytta av detta medan det fortfarande är gratis och få gratis DNA-matchningar och gratis etnicitetsuppskattning för dina befintliga data. Med MyHeritages omfattande DNA-databas med mer än en miljon människor, av vilka de flesta endast testats på MyHeritage, är det här enkelt. Du får dina resultat gratis efter 1-2 dagar eller mindre.

Om du redan hanterar mer än ett DNA-kit på MyHeritage, vänligen ta dig tid att verifiera att varje kit du hanterar är associerat med rätt person. Detta kan fixas, om det behövs, genom att använda sidan ”Hantera DNA-kits”, tillgänglig från DNA-menyn. Använd alternativet ”Omfördela kit till en annan person” om du har ett kit som inte är korrekt kopplat. Detta är nödvändigt om alla kits som du laddar upp för flera släktingar fortfarande är kopplade till din egen släktträdsprofil.

Slutligen är DNA-kits på MyHeritage mycket mer användbara när det finns ett släktträd i samband med dem. Detta gör att du kan få bättre insikter om dina DNA-matchningar, till exempel genom förekomsten av Smart Matches, gemensamma föfäders efternamn eller gemensamma förfäders födelseplatser. Om du har ett DNA-kit på MyHeritage, men inget släktträd eller ett mycket litet släktträd, är det bra att skapa ett släktträd eller förbättra ditt befintliga släktträd. Det kommer att gynna dina DNA-matchningar, men i första hand kommer det att gynna dig.

Lycka till!
MyHeritage-teamet

 

Kommentarer

E-postadressen hålls privat och kommer inte att visas.

  • Jörgen Sundin

    februari 16, 2018

    Kan DNA-test från FTDNA användas hos MH ? I så fall hur gör jag då ?

    • Daphna

      mars 21, 2018

      Hej Jörgen,

      Du kan ladda upp dina DNA-data från FTDNA till MyHeritage. Gå till DNA på menyn, klicka på Ladda upp DNA-data och följ instruktionerna som följer. Lycka till!

  • Gunilla Lengard Tegnér

    februari 17, 2018

    Hej!
    Jag har gjort DNA test genom familytreedna.org
    Kan jag lägga till detta till Myheritsge?
    Mvh
    Gunilla

    • Daphna

      mars 21, 2018

      Hej Gunilla, Ja du kan absolut lägga upp dina resultat på MyHeritage.

  • leif grelsson

    februari 18, 2018

    När kommer uppdateringen avseende kromosomwebbläsare ?

    • Daphna

      mars 21, 2018

      Hej Leif, den nya uppdateringen är live nu, läs gärna