GEDCOM

  • GEDCOM ist die Abkürzung für Genealogical Data Communication und ist ein Dateiformat, das die Inhalte einer Familiendatei von den verschiedensten Genealogie-Programme gelesen und verstanden werden kann.

  •  

    Wer hat's erfunden?
    Wie funktioniert das?
    Was Anwender glauben....
    Das Problem mit der Gedcom-Datei
    Selbstdefinierte Fakten

     

  •  

    Wer hat's erfunden?

    Entwickelt wurde der GEDCOM-Standard von der Kirche Jesus Christus der Heiligen Letzten Tage, den Mormonen, die auch das Copyright besitzen. Obwohl es eigentlich als universell einsetzbares Datei-Format für den Austausch von Daten der Mormonen gedacht war, hat mittlerweile fast jedes Programm diese Funktion übernommen und modifiziert. Ein Programm ohne GEDCOM-Schnittstelle ist unverkäuflich und daher gibt es auch kein einziges Programm ohne diese Möglichkeit.


  • Wie funktioniert das?

    Eine GEDCOM-Datei besteht aus einer Reihe von Textkürzeln, wobei jedes ein bestimmtes Teil der Familiendatei beinhaltet. Die einzelnen Linien sind nummeriert. Es ist sogar möglich, eine GEDCOM-Datei selbst zu schreiben, aber das ist eine schweißtreibende Arbeit. So enthält eine GEDCOM-Datei von etwa 400 Personen schätzungsweise 5000 bis 6000 Zeilen! 

    Wenn Sie eine GEDCOM-Datei mit dem Wordprozessor öffnen, sehen Sie ein scheinbares Durcheinander, Zeile für Zeile gefüllt mit Nummern, Abkürzungen und Daten-Bruchstücken. Einzelne Gruppen dieser Zeilen, die Informationen über eine Person (INDI), eine Quelle (SOUR) oder eine Familie (FAM)  enthalten, bezeichnet man als records, und jede Zeile in einem "record" hat eine "level number". Die erste Zeile eines jeden "record" hat die Nummer "0" um anzuzeigen, dass hier ein neuer "record" beginnt. Das bedeutet, dass Informationen so lange zu ein und derselben Person gehören, bis wieder eine Zeile mit "0" beginnt.

    Beispiel:

    0 NAME Joseph /Hayen/
    1 SEX M
     
    1 BIRT 
    2 DATE 13 FEB 1922 
    2 PLAC Leer, Ostfrld.,Niedersachsen

    (Dieser "record" betrifft solange Joseph Hayen, bis am Zeilenanfang wieder ein 0 steht)

    0 NAME Martha /Wessels/ (hier beginnen die Daten zu einer neuen Person)
    1 SEX F  
    1 BIRT 

    Hinter jeder Nummer steht eine Abkürzung, die den Datentyp der Zeile festlegt. HUSB für Ehemann, PLAC für Ort, MARR für Trauung, usw. Diese Hinweise können auch aus Zeichen bestehen (@S43@), die zu anderen Personen, Familien oder Quellen in der Datei verweisen.

    Jeder Familienforscher sollte wissen, dass nicht jedes Genealogie-Programm alle Abkürzungen beherrscht, vor allem dann nicht, wenn diese Ereignisse selbst eingebunden wurden. Das bedeutet, dass die entsprechenden Daten, die mit diesem Kürzel transportiert werden sollen, ignoriert werden und verloren gehen.

    Wenn eine GEDCOM-Datei importiert wird, benutzt das Genealogieprogramm die oben erklärten Nummern und Abkürzungen, die Familiendatei mit allen verwandtschaftlichen Beziehungen wieder herzustellen. Die Software liest die Zeilen-Nummern und Abkürzungen, und versucht nun, die enthaltenen Informationen in den eigenen Feldern abzulegen.  Wenn die Software eine Abkürzung nicht erkennt, ignoriert es die entsprechende Zeile oder plaziert sie in einem speziellen Feld, von wo  aus man sie später selbst verschieben kann. 

    Der Kopf beinhaltet Informationen wie das Ausgangsprogramm, das diese GEDCOM-Datei erzeugt hat (SOUR) und viele andere Details:

    0 HEAD
    1 SOUR REUNION
    (das Programm, das die Datei erzeugt hat: Reunion)
    2 VERS V5.0
    (Versions-Nummer des Programmes)
    1 DEST ANSTFILE
    (das Programm, das die Datei importiert)
    1 DATE 12 NOV 1997
    (Tag der Erstelung der GEDCOM Datei)
    1 FILE Paternal Family File 4.0
    (Name der Familien-Datei)
    1 GEDC
    2 VERS 5.1
    (die Versions-Nummer des angewandten Gedcom-Standards)
    1 CHAR IBM DOS
    (das character set der importierenden Software)

    Als nächstes folgt die Aufzeichnung einer Person. Seine individuelle Referenznummer ist 302.

    0 @I302@ INDI
    1 NAME Michael /FITZGERALD/
    1 SEX M
    1 BIRT
    2 DATE 1842
    2 PLAC Duncannon, Ireland
    1 DEAT
    2 DATE 3 JAN 1916

    1 OCCU Theater Stage Hand
    1 NOTE Emigrated from Ireland in 1860, prob. landed at the Battery, New York City. Had a brother who emigrated later and settled in Boston. Michael worked for the old Forepaugh's Theatre as a stage hand and collected autographs and news clippings of
    2 CONT stage stars; spoke with a thick Irish brogue and known for his wit.
    1 SOUR @S2@
    1 HEAL Died of le grippe.
    1 FAMS @F107@

    CONT bedeutet, dass das Feld darüber mehr Text enthält als es aufnehmen kann. Es wird an dieser Stelle fortgesetzt. SOUR zeigt an, an welcher Stelle die Information abgelegt ist. In diesem Fall folgt ein Verweis auf Quellen-Nummer 2. FAMS verweist auf einen Familienzusammenhang.

    Später folgen in der Datei die aufgelisteten Familien ( FAM ).

    Hier zum Beispiel wird die Familie mit der Nummer 107 angeführt vom Ehemann ( HUSB), dessen Personen-Nummer 302 ist, gefolgt von seiner Frau ( WIFE)  deren Personen-Nummer 303 ist und deren Kinder (CHIL), deren Personen-Nummern aufgezählt werden. Ebenfalls enthalten sind die Trauungsdaten ( MARRiage DATE):

    0 @F107@ FAM
    1 HUSB @I302@
    1 WIFE @I303@
    1 CHIL @I38@
    1 CHIL @I316@
    1 CHIL @I111@
    1 CHIL @I109@
    1 CHIL @I318@
    1 CHIL @I36@
    1 CHIL @I321@
    1 MARR
    2 DATE 17 DEC 1862

    Soweit die wichtigsten Informationen über eine Gedcom-Datei. Bedenken muss man dabei, dass eine Datei viele weitere Informationen einschließt. All diese Informationen werden Zeile für Zeile aufgelistet, meist zuerst die Personen, dann die Quellen, und schließlich die Familien. 

  •  

    Was Anwender glauben...

    Die Anwender glauben meist, dass die GEDCOM-Schnittstelle ihre in eine Genealogiesoftware eingegebenen Daten (die Familiendatei) problemlos in ein anderes Programm übertragen kann - beispielsweise bei einem Programmwechsel. Das Vorhandensein einer solchen Schnittstelle wiegt sie in Sicherheit. Wenn sie dann bei der Übertragung der Familiendatei auf Probleme stoßen, ist aus ihrer Sicht entweder das eine oder das andere Programm Schuld.

  •  

    Das Problem hinter der GEDCOM-Datei

    Das Problem ist ganz einfach: Für die Mormonen, die das Format einst eintwickelten, sind nur die Standarddaten wichtig. Sie wollten lediglich gewährleisten, dass die Geburts- und Heiratsdaten aus einem beliebigen Programm in die Mormonen-Datenbank übertragen werden können. Erst mit den immer höher werdenden Ansprüchen der Anwender kamen die Probleme. Plötzlich sollten auch Trauzeugen, Taufdaten, jüdische Rituale, Todesursachen, Auswanderungen und vieles mehr im Programm einen Platz haben. Die GEDCOM-Schnittstelle wurde erweitert, aber dadurch entstand ein neues Problem. Jedes Programm hat seine ganz eigene Art mit Informationen umzugehen. Vergleicht man Genealogieprogramme mit einem Auto, dann gibt es einen Smart - und es gibt daneben einen Opel Zafira mit 7 Sitzen. Wenn nun alle Personen aus dem Zafira aussteigen um sich in den Smart zu setzen, bleiben zwangsläufig einige Leute auf der Strasse stehen. So verhält es sich auch mit den Informationen in einer Gedcom-Datei: Die Informationen, die im empfangenden Programm keinen Platz finden verschwinden- oder landen im günstigsten Fall in den Notizen.

    Es gibt Programme, die für jeden einzelnen Fakt Quelleninformationen aufnehmen - und andere, bei denen man je Person alle Fakten in ein Notizfeld schreiben muss. 

    Sie verstehen nun sicherlich, weshalb die verlustfreie Datenübertragung von einem Programm in ein anderes reines Wunschdenken ist.

    Selbstdefinierte Fakten

    Das GEDCOM-Format selbst ist auf eine Vielzahl von Eventualitäten vorbereitet. So lassen sich auch neue Fakten integrieren, an die das GEDCOM-Format selbst noch gar nicht gedacht hat. Der Entwickler einer Software kann daher durchaus ein Informationsfeld "Hebamme bei der Entbindung" anbieten und die hier gesammelten Inhalte in die GEDCOM-Datei schreiben. Ja, er kann sogar dem Anwender die Möglichkeit einräumen, selbst eigene Informationsfelder anzulegen. Wenn Sie bis hierher gelesen haben, ahnen Sie bereits was nun kommt: Was nutzen all die vielen Informationen "artgerecht" in der GEDCOM-Datei, wenn kein anderes Programm diese Felder hat um die Informationen dort wieder abzulegen?

    Ok, nun heißt es überlegen und eine Entscheidung zu treffen. Die Entscheidung hat weitreichende Konsequenzen und man sollte sie nicht über's Knie brechen. Für die Entscheidung gibt es eigentlich nur wenige Fragen.

    Ein eigenes Faktenfeld macht theoretisch nur dann Sinn, wenn Sie die dort eingetragene Information als Filter- oder Sortierkriterium nutzen möchten. Beispiel: Eine Liste mit allen ausgewanderten Personen, mit allen Schornsteinfegern oder allen im Krieg Gefallenen erstellt man sehr wahrscheinlich nur, wenn ein entsprechendes Informationsfeld ausgefüllt wurde - vorausgesetzt,  das Programm bietet eine sehr individuelle Listenfunktion an. Ein Informationsfeld "Haarfarbe" macht ergo nur dann Sinn, wenn Sie eine Liste erstellen wollen, die alle Rothaarigen anzeigt..... ein Informationsfeld "Hebamme bei der Geburt" oder "Anzahl von Sommersprossen" oder ähnliches macht überhaupt keinen Sinn. Das Notizfeld ist in solchen Fällen vollkommen ausreichend. 

    Ein anderes Entscheidungskriterum ist: Sie haben sich dafür entschieden, Informationsfelder selbst anzulegen... zum Beispiel einen Fakt "Paten" oder "Trauzeugen", weil die Software keine Patenverwaltung anbietet. Das ist aabsolut kein Problem, solange man fast ausschließlich mit diesem Programm arbeitet. Nun gibt es aber Forscher, die für unterschiedlichste Ausgaben mehrere Zweitprogramme im Einsatz haben. Diese Programme aber müssen die Informationsfelder anhand der GEDCOM-Datei korrekt interpretieren und importieren können. Wenn Zweitprogramm A nun eine Patenverwaltung hat, dann wird es trotzdem die Infos im selbst definierten Infofeld NICHT korrekt einlesen können. Zur Erklärung: Ein selbstdefinierter Fakt beginnt immer mit einem Unterstrich innerhalb der GEDCOM-Datei. Im allerbesten Fall landet der Inhalt eines selbstdefinierten Feldes das nicht erkannt wird in den Fakten - oder das importierende Programm fragt, wo es diese Information ablegen soll. Bei vielen  Programmen aber landen solche Informationen im Nirvana - sie werden ignoriert. Warum erkläre ich das so langatmig? Um Ihnen zu zeigen dass manche Information tatsächlich am besten in den Notizen aufgehoben ist....zur Sicherheit wählen Sie dann aber bitte das Notizfed zur Person. Warum das nun wieder?  Ganz einfach: Es gibt Programme, die bieten zu jedem Ereignis ein eigenes Notizfeld an. Wenn Sie aber zu den "Multi-Software-Anwendern" gehören und die GEDCOM-Datei mit einem Programm öffnen das nur ein Notizfeld zur Person anbietet droht eben auch Datenverlust. Daraus folgt: Fakten anlegen kann jeder vollkommen ohne Nachteile, wenn er bei seinem Programm bleibt und sich auch regelmäßig Updates gönnt. Wer auch mal andere Programme nutzen will sollte seine Dateneingabe auf ganz grundsätzliche Positionen begrenzen: Nur das Haupt-Notizfeld zur Person und Verzicht auf weit hergeholte Faktenfelder... das gilt übrigens auch für die Quellenangaben. 

    Ergo: Hände weg von selbstdefinierten Fakten!

    und: Nutzen Sie in Ihrem Programm nur die allgemein üblichen Felder, wenn Sie u.U. irgendwann mit Ihren Daten in ein anderes Programm umziehen möchten.