MyHeritage Lanserar Book Matching

MyHeritage Lanserar Book Matching

Vi är glada att tillkännage lanseringen av en revolutionerande ny teknik— Book Matching — kanske vår bästa teknik ännu. Book Matching söker automatiskt individer som finns i släktträd på MyHeritage i vår stora samling av digitialisrade historiska böcker. Unikt för MyHeritage använder sig den innovativa nya tekniken sig av semantisk analys för att förstå varje mening på varje sida i de digitaliserade böckerna, så hitta den kopplingar i mycket hög noggrannhet. Bok Matching har redan producerat över 80 miljoner nya träffar för våra användare! Varje koppling är ett stycke från en bok specifikt om personen i släktträdet. Kopplingen ger direkt tillgång till det stycket och möjligheten att bläddra igenom resten av boken.

Med Book Matching, kommer du att upptäcka fascinerande familjeinformation som du inte skulle hittat på annat sätt. Du kan även upptäcka nya släktingar och förfäder. Använd denna information för att utöka ditt släktträd.

Bakgrund: under 2012 lanserade vi först vår sökmotor för historiska dokument SuperSearch™. I december 2015, läggs en katalog av digitaliserade historiska böker till SuperSearch™. Nyligen har vi tredubblat böckerna i sammanställning av publicerade källor från 150.000 till 450.000 böcker , med totalt 91 miljoner sidor. Vi har etablerat ett team av hårt arbetande kuratorer och planerar att lägga till ytterligare hundratals miljoner av sidor av digitaliserade böcker till samlingen varje år

Utmaningen

Böcker har alltid varit en av de bästa källorna för släktforskning. Men att söka dem på ett effektivt sätt har varit nästan omöjligt. Även efter böcker fotograferats och omvandlas till digitala filer med sökbar text genom optisk teckenigenläsning (OCR), brukar det alltid kräva en stor investering i tid och vilja att vada en väg genom oändliga falska positiva. Till exempel, om du har en Richard Thomas i ditt släktträd, skulle en textsökning i böcker hitta resultat för människor som heter Richard, eller Thomas, utan hänsyn till för- eller efternamn. Även om en Richard Thomas påträffades, skulle det sannolikt inte vara den du letade efter. Det finns inget sätt att hitta den exakta Richard Thomas som du letar efter, till exempel den Richard Thomas född i Virginia i början av 1940-talet, gift med en Wilma Griffith.

Book Matching till undsättning

Vår Book Matchning teknik övervinner dessa svårigheter genom att automatiskt förstå berättelser som beskriver människor i de historiska böckerna, däribland namn, händelser, datum, platser och relationer. Sen kopplar den med extremt hög precision och hastighet till de 2 miljarder personer i släktträd på MyHeritage; detta upprepas automatiskt när du lägger till i ditt träd och när vi lägger till fler böcker.

En svår uppgift gjord lätt

Att extrahera genealogisk information från böcker är inte en enkel uppgift. I strukturerade dokument såsom födelsebevis eller folkräkningar, är det mycket tydligt vilken typ av information som presenteras i de data du möter. Det är tydligt var att hitta efternamn, födelsedatum, och så vidare. Å andra sidan, i ostrukturerade fri-textdata, som digitaliserade historiska böcker, kan fakta såsom födelsedatum, platser och dödsdatum vara skriven på många olika sätt och i olika sammanhang. Informationen har ingen anvisad plats eller ordning. Medan allmänna fraser som ”död”, ”dog”, ”avled” kan alla hänvisa till en persons död, så kan mindre vanligt förekommande fraser som ”gått bort”, ”avslutade sin jordiska karriär” eller ”kallats hem” också användas. ”Vi har för närvarande ett stort antal regler bara för att upptäcka uttryck som beskriver döden! Böcker hänvisar oftast inte till en person genom ett fullständigt namn; till exempel, kan ett stycke nämna en kvinna med bara hennes förnamn och sedan fortsätta med att namnge och beskriva hennes far. Specialiserad teknik behövs för pussla ihop och följa detta. Vi har arbetat hårt för att bygga ett stort antal algoritmer för att skörda familjehistoriers information från böcker. Dessa har testats och utvecklats upprepades gånger för att säkerställa en hög nivå av noggrannhet, och för att samla in så mycket information som möjligt från böckerna. I processen, har vi framgångsrikt övervunnit miljontals OCR fel och fixat dem. Till exempel, om OCR-processen trodde att en person är född i ”]\laj”, förstår vi att det är riktigt maj ”Apnl” är verkligen ”april”, och så vidare. För närvarande är några böcker i samlingen av digitaliserade böcker dubbletter eftersom de var utsatta offentligt flera gånger av olika grupper. Ingen kunde räkna ut att vissa av dem är överflödiga. Vi håller på att klar ställa specialiserad teknik som kan hitta och ta bort kopiorna. När vi slutfört detta arbete kommer automatiskt alla dubbletter att försvinna.

Book Matching i Aktion:

Vi visade nyligen några av de ledande släktbloggarna deras bok kopplingar så att de kunde se för sig själva de kopplingar som hittades för deras egna släktträd.

Dick Eastman från Eastman’s Online Genealogy Nyhetsbrev har forskat sin familjehistoria i flera år. Han har ca 2780 personer i sitt släktträd på MyHeritage , och han fick cirka 500 bok träffar. Huvuddelen av informationen i träffarna var nytt för honom.

Till exempel, Elizabeth Fifield , Dicks förfader (8de generation) faster, fanns i hans släktträd med endast födelse- och dödsdatum, och syskon.

En automatisk bok koppling hittades för Elizabeth i booken ”Genealogical and personal memoirs relating to the families of the state of Massachusetts; av Cutter, William Richard, 1847-1918,” en källa som Dick Eastman inte tror han skulle ha tänkt att söka i själv.

Utdraget nedan är det avsnitt som hittades av MyHeritage. Den spännande nya informationen här visar Elizabeth make och historisk information om honom och hans familj, till exempel deras sex barn och deras födelsedatum. Detta ver all information som Dick inte tidigare hade som han nu kan lägga till sitt släktträd.

Karriär släktforskaren Randy Seaver av Genea-Musings har mer än 40,000 folk i sitt släktträd på MyHeritage. Med 17,323 bok kopplingar, kan han nu se en hög av ny information om folk i hans släktträd!

Till exempel, har Randy en släktning, William Seaver Woods, i sitt släktträd. William har ett födelsedatum, och är skriven som ogift.

Helt oväntat, i årsboken ”Alumni Record of Wesleyan University, Middletown, Connecticut, 1921”, hittade MyHeritage en perfekt match för William.

William råkade studera vid detta universitet, och sidorna beskriver hans bedrifter, och nämner att han hade en fru och ett barn, båda som saknas från Randys släktträd. Man kan se att Robert, deras son använde efternamnet Crombie, från sin mamma, Grace. Eftersom Robert inte använde Seaver eller Woods efternamnet kanske Randy inte skulle ha upptäckt honom uttan denna skatt. Nu har Randy en färsk ledtråd. Han kan forska i en ny riktning och följa den till nutiden, var han förr hade kommit till ett tvär stopp.

Leland Meitzler av Genealogy Blog har importerat sitt släktträd på 5106 inlägg till MyHeritage. han fick 620 Book Matches. Leland fick anmälan om en träff för Elisha Mills i sitt släktträd. Elisha hittades i boken ”A Walloon Family in America: Lockwood de Forest and His Forbears 1500-1848,” (1914).

Träffen läggs till Elishas föräldrar. Den informerar hans bedrifter under Revolutionära Kriget.

Slutligen, Pat Richley av Dear Myrtle fick också några kopplingar. Thomas Wasden, Pat’s farfars farfar, visades tidigare i trädet med grundläggande information, inklusive datum och platser.

En träff för Thomas hittades automatiskt i boken ”Colonial Families of Philadelphia av Jordan, John Woolf, 1840-1921” (1911).

Träffen inkluderade ett foto av honom från 19 hundra talet. Vilket underbart fynd som Pat nu kan lägga till sitt släktträd.

Släktforskarna häpnades av dessa spännande, aldrig tidigare sedda kopplingar, som lade till värdefull information till deras släktträd. Inga falska kopplingar påträffades. Om Book Match kan införa en sådan enorm mängd ny data till rutinerade släktforskare som har forskat i sin släkthistoria i årtionden, kan ni föreställa er hur bra Book Matchning kan vara för dig och varje användare av MyHeritage.

Compilation of Published Sources kollektionen är gratis. För att använda Book Matches behövs ett MyHeritage Data abonnemang.

Vad Sen? Book Matching finns tillgängligt bara för engelska böcker, men teknologin tilllämpas snart fär andra språk. Vi expanderar kontinuerligt vårt arkiv av digitaliserade historiska dokument, vilket underlättar släktforskning. Vi förväntar oss att lagret av digitaliserade böcker på MyHeritage fördubblas inom kort.

Hur vet du om du har en Book Match? Logga bara in på din sida och kolla dina Record Matches via Upptäckter menyn , eller titta i din inkorg för Record Match mejl – dessa skikas till våra användare under de kommande dagarna. Alla träffar du får har gjorts möjliga med denna nya teknologi.
Ny till MyHeritage? Registrera dig på vår hemsida, ladda upp ditt släktträd som en GEDCOM fil för att snabt ta nytta från Book Matching — vilket är exklusivt på MyHeritage.

Du kommer att bli förvånad över värdet av böcker och få en ny uppskattning för dem som en genealogisk resurs med den nya Book Matchning tekniken.

Njut!

Kommentarer

E-postadressen hålls privat och kommer inte att visas.

  • Björn A. W. Adelöw

    april 18, 2016

    Detta kommer att bli mycket spännande för släktforskningen !!!
    En stor till My Heritage duktiga medarbetare som utvecklar dessa
    möjligheter.

    Med bästa hälsningar

  • Gunvor Larsson

    april 18, 2016

    Detta låter ju helt fantastiskt! Man kunde inte ens tänka sig att sådant kunde ske. Jag skall hoppas att det finns något till mig också…

  • Lars-Gunnar Lindström

    april 19, 2016

    Låter intresant

  • BLG

    april 19, 2016

    Spännande!!

  • Ewa Kjörsvik

    april 20, 2016

    Kul, jag ser fram emot nya spännande rön om min förtida släkt- Hoppas, hoppas på nya upptäckter.

  • Patrik Andersson

    april 21, 2016

    Det blir intressant! Tar det lite tid innan man får book-matchIng på sin hemsida

  • Majlis Frisk Ejerås

    maj 10, 2016

    Verkar mycket bra kommer det som ett tillägg under matchningar ?