Gedcom

Publié le février 14, 2022 dans Gedcom

Gedcom

Vous avez dit GEDCOM?

GEDCOM est l’abréviation de GEnealogical Data COMmunication (Communication de Données Généalogiques). C’est un format de fichier défini initialement par l’Eglise des Mormons pour permettre les échanges de données généalogiques informatisées au sein de leur communauté. Ce format est devenu aujourd’hui le standard international des échanges d’informations entre la quasi-totalité des logiciels de généalogie. Un fichier au format GEDCOM est une base relationnelle d’informations généalogiques mise en forme de fichier séquentiel. Une base relationnelle est un fichier dont la structure permet de gérer des informations liées entre elles par une relation. Deux individus, par exemple, peuvent être liés par une relation de type ‘mariage’ ou ‘parent-enfant’. Dans un fichier séquentiel, les informations sont stockées les unes à la suite des autres. Les informations généalogiques que l’on trouve dans un fichier GEDCOM (fichier séquentiel) sont caractérisées par une balise et peuvent être associées entre elles par un ensemble pointeur/adresse  qui permet de relier une information à une autre. Depuis sa création, le format GEDCOM a évolué et la norme GEDCOM version 7 publiée en juin 2021 est la plus récente. Mais la version GEDCOM 5.5 reste encore en 2022 la version la plus couramment utilisée par les logiciels de généalogie à cause des évolutions importantes introduites dans GEDCOM version 7 qui n’ont pas été intégrées par tous les logiciels. De version en version, de nouvelles balises ont été ajoutées pour gérer des informations supplémentaires, et certaines ont été supprimées.Tous les programmes de généalogie ne sont pas compatibles avec les différentes versions de la norme GEDCOM. Lors de l’import d’un fichier GEDCOM, un programme ignorera généralement les informations associées aux balises qu’il ne reconnait pas.

 

Le langage GEDCOM version 5.5

On peut rencontrer dans un fichier GEDCOM quatre formats de ligne différents. Pour décrire les informations qui sont regroupées dans une structure et n’ont pas de relations avec d’autres informations du fichier, on trouvera des lignes dont la syntaxe sera:

Format 1
{niveau} espace {balise}

ou

Format 2
{niveau} espace {balise} espace {informations}

… et pour les informations qui doivent être mises en relation avec d’autres qui sont placées à un autre endroit dans le fichier, on trouvera:

Format 3
{niveau} espace @{référence}@ espace {balise}

ou

Format 4
{niveau} espace {balise} espace @{référence}@

 

Légende

  • {niveau} : c’est une valeur numérique de 0 à n qui permet de structurer la hiérarchie des informations. Les informations du niveau n sont toujours associées à celles du niveau n-1 qui précéde pour les préciser. Il est très important de respecter l’ordre dans lequel les informations d’un fichier GEDCOM doivent être classées.
  • {balise} : les balises sont des mots-clés de 3 ou 4 caractères du langage GEDCOM prédéfinis qui caractérisent les informations fournies, comme INDI pour individu, MARR pour mariage, FAM pour famille, etc (voir la liste des balises ci-dessous)
  • @{référence}@ : les références sont les étiquettes qui permettent d’établir des relations entre des informations. Ces références sont des suites de chiffres et/ou de lettres quelconques toujours délimitées par un caractère @ au début et à la fin. Sur une ligne d’un fichier GEDCOM, une référence citée avant une balise marque l’emplacement d’une information (c’est une adresse). Une référence citée après une balise permet d’établir une relation avec une information définie par l’adresse correspondante (c’est un pointeur). C’est l’existence d’une ligne comportant une adresse et d’une ou de plusieurs lignes qui contiennent un pointeur sur cette adresse qui matérialise une(des) relation(s). Dans un fichier GEDCOM, la référence utilisée dans chaque « ligne adresse » doit être unique: on ne peut pas retrouver la même référence utilisée comme adresse dans deux lignes différentes, mais plusieurs pointeurs (donc plusieurs « lignes pointeurs ») peuvent renvoyer à cette « ligne adresse ».
  • {informations} : ce sont les données généalogiques qui peuvent être codées dans un format spécifique (dates), sous forme de texte libre (chaînes de caractères) ou qui sont des constantes pré-définies dans le langage (M ou F pour indiquer le sexe, par exemple).

 

Décoder les informations d’un fichier GEDCOM

Tout fichier GEDCOM débute obligatoirement par un entête (balise HEAD) et se termine obligatoirement par une marque de fin (balise TRLR). Entre l’entête et la marque de fin, on trouvera principalement les types d’informations suivants:

  • les informations relatives aux individus (balise INDI)
  • les informations relatives aux familles (balise FAM)
  • les notes (balise NOTE)
  • les sources (balise SOUR)

 

La norme GEDCOM comprend beaucoup d’autres balises dont vous trouverez la description plus loin dans cette page. Un bon nombre d’entre eux n’a d’utilité que pour les membres de l’Eglise des Mormons. Certains programmes utilisent des balises spécifiques supplémentaires. Les informations associées à ces balises spéciales ne pourront pas être transférées entre différents logiciels par Export/Import d’un fichier GEDCOM si le logiciel récepteur n’a pas prévu la reconnaissance des balises de l’émetteur.

 

Exemple d’analyse d’un fichier

L’entête

0 HEAD ===> entête du fichier
1 SOUR Legacy ===> logiciel créateur du fichier
2 VERS 2.0 ===> version du logiciel
2 NAME Legacy for Windows ===> nom du programme/système
2 CORP Millennia Corp. ===> nom de l’organisme, société, entreprise
3 ADDR PO Box 1800 ===> adresse
4 CONT Duvall, WA 98019 ===> suite de l’adresse
1 DEST Legacy ===> système destinataire du fichier
1 DATE 10 Sep 1998 ===> date de création du fichier
1 CHAR ANSI ===> jeu de caractères utilisé
1 SUBM @S0@ ===> auteur (pointeur vers l’auteur @S0@)
1 FILE ancetres.ged ===> nom du fichier GEDCOM
1 GEDC ===> identification GEDCOM
2 VERS 5.5 ===> version utilisée
2 FORM LINEAGE_LINKED ===> format utilisé

 

L’auteur du fichier

0 @S0@ SUBM ===> définition de l’auteur @S0@
1 NAME Louis JEANPIERRE ===> nom de l’auteur

 

Un individu de la généalogie

0 @I1@ INDI ===> définition de l’individu @I1@
1 NAME Jules Albert /Leprince/ ===> prénoms/nom
1 SEX M ===> sexe masculin
1 BIRT ===> naissance
2 DATE 19 Aug 1875 ===> date
2 PLAC Metz, 57, F ===> lieu
2 SOUR @S1@ ===> source (pointeur vers la source @S1@)
3 PAGE pg 56 ===> numéro de la page
1 DEAT ===> décès
2 DATE 21 Feb 1947 ===> date
2 PLAC Nancy, 54, F ===> lieu
1 CHAN ===> dernière modification
2 DATE 10 Sep 1996 ===> date
3 TIME 09:07 ===> et heure
1 FAMS @F3@ ===> famille de son couple (pointeur vers famille @F3@)
1 FAMC @F1@ ===> famille de ses parents (pointeur vers famille @F1@)
1 OCCU mécanicien ===> profession
1 NOTE @NI1@ ===> note associée à l’individu (pointeur vers note @NI1@)

 

Une famille

0 @F1@ FAM ===> définition de la famille @F1@
1 HUSB @I3@ ===> le mari (pointeur vers l’individu @I3@)
1 WIFE @I4@ ===> l’épouse (pointeur vers l’individu @I4@)
1 MARR ===> mariage
2 DATE 5 Mar 1874 ===> date
2 PLAC Sarcey, 69, F ===> lieu
2 NOTE @NF1@ ===> note associée au mariage (pointeur vers note @NF1@)
1 CHIL @I1@ ===> 1er enfant de la famille (pointeur vers @I1@)
1 CHIL @I2@ ===> 2ème enfant de la famille (pointeur vers @I2@)
1 CHAN ===> dernière modification
2 DATE 30 May 1998 ===> date
3 TIME 15:24 ===> et heure

 

Une note

0 @NI1@ NOTE blablabla… ===> début du texte de la note @NI1@
1 CONT etc… ===> suite du texte de la note
1 CONT etc… ===> suite du texte

Autre format possible, la note est directement incluse dans une structure (INDIvidu, FAMille…):

0 @I19@ INDI ===> définition de l’individu @I19@
1 NAME Alphonse /Leprince/ ===> prénoms/nom

1 NOTE blablabla… ===> début du texte de la note
2 CONT etc ===> suite du texte

 

Une source

0 @S1@ SOUR
1 ABBR Les familles de Pontaudouce, par David Koskoff.
1 TITL Les familles de Pontaudouce, par David Koskoff.

 

Un individu sans lien de parenté (ami, voisin, parrain…)

O @I9@ INDI
1 NAME René/LAMORCE/
1 ASSO @I4@
2 RELA parrain

 

La marque de fin de fichier

0 TRLR ===> marqueur de fin de fichier

 

La liste des balises GEDCOM 5.5 et leur définition

Le nom complet en anglais de la balise est indiqué entre {crochets} pour une meilleure compréhension, mais c’est toujours le nom abrégé en 3 ou 4 caractères qui est utilisé dans les fichiers GEDCOM.

… ABBR {abbreviation} : titre abrégé, description abrégée ou nom abrégé.
… ADDR {address} : adresse postale d’un individu, de l’auteur d’un fichier, d’une entreprise, d’une école, etc
… ADR1 {address1} : première ligne d’une adresse
… ADR2 {address2} : deuxième ligne d’une adresse
… ADOP {adoption} : création du lien enfant-parent quand il n’existe pas de lien biologique.
… AFN {AFN} : numéro unique et permanent du fichier Ancestral File qui contient les informations relatives à l’individu
… AGE {age} : âge de l’individu au moment de l’événement ou âge qui figure dans le document.
… AGNC {agency} : institution ou individu responsable ou décisionnaire
… ALIA {alias} : indicateur qui associe des informations différentes sur une personne.
… ANCE {ancestors} : ancêtres d’un individu
… ANCI {ances_interest} : indique un intérêt à rechercher des informations complémentaires sur les ancêtres d’un individu (voir DESI)
… ANUL {annulment} : déclaration de nullité d’un mariage (comme s’il n’avait pas eu lieu)
… ASSO {associates} : indicateur qui relie des amis, des voisins, des parents ou d’autres personnes à un individu
… AUTH {author} : nom de la personne qui a relevé les informations ou qui a constitué le fichier
… BAPL {baptism-LDS} : baptême de l’Eglise des Mormons (à partir de l’âge de huit ans)
… BAPM {baptism}: baptême (non Mormon, voir aussi BAPL et CHR)
… BARM {bar_mitzvah} : cérémonie juive qui a lieu pour les garçons à l’âge de 13 ans
… BASM {bas_mitzvah}: cérémonie juive qui a lieu pour les filles à l’âge de 13 ans, aussi appelée « Bat Mitzvah. »
… BIRT {birth} : naissance
… BLES {blessing} : bénédiction religieuse
… BLOB {binary_object} : ensemble de données utilisé par un système multimédia qui gére des données binaires qui représentent des images, du son et de la vidéo.
… BURI {burial} : sépulture
… CALN {call_number} : numéro dans un répertoire qui sert à identifier une pièce dans une collection.
… CAST {caste} : rang ou statut d’un individu dans une société, selon des critères raciaux ou religieux, des critères de richesse ou autres
… CAUS {cause} : description de la cause de l’événement ou du fait associé, cause du décès par exemple.
… CENS {census} : recensement de population
… CHAN {change} : correction ou modification; en relation avec une DATE qui indique quand le changement est survenu.
… CHAR {character} : indique le jeu de caractères utilisé pour l’enregistrement des informations dans le fichier.
… CHIL {child} : enfant naturel ou adopté
… CHR {christening} : baptême religieux (non Mormon) d’un enfant.
… CHRA {adult_christening} : baptême religieux (non Mormon) d’une personne adulte.
… CITY {city} : ville ou village
… CONC {concatenation} : indicateur de continuation des informations qui précédent.– Ces informations doivent être mises à la suite de celles qui précédent sans espace ni retour au début de ligne. La coupure avec les informations précédentes doit être faite au milieu d’un champ et non pas sur un espace (l’espace est un délimiteur GEDCOM).
… CONF {confirmation} : confirmation – cérémonie religieuse (non Mormon) par laquelle un individu acquiert la qualité de membre à part entière de son Eglise.
… CONL {confirmation_l} : confirmation (cérémonie religieuse par laquelle un individu devient membre de l’Eglise des Mormons)
… CONT {continued} : indicateur de continuation des informations qui précédent, après un retour à la ligne.
… COPR {copyright} : protection des informations contre la reproduction et la diffusion.
… CORP {corporate} : nom d’une entreprise, d’une institution ou autre.
… CREM {cremation} : incinération du corps d’un individu décédé.
… CTRY {country} : nom ou code du pays
… DATA {data} : informations stockées automatiquement.
… DATE {date} : date d’un événement au format prévu pour les dates
… DEAT {death} : décès
… DESC {descendants} : descendance d’un individu
… DESI {descendant_int} : indique un intérêt à rechercher des descendants de l’individu (voir aussi ANCI)
… DEST {destination} : système ou programme destinataire des données.
… DIV {divorce} : dissolution du mariage
… DIVF {divorce_filed} : dossier de divorce d’un époux
… DSCR {phy_description} : caractères physiques de description d’une personne, d’un lieu ou d’une chose
… EDUC {education} : niveau d’instruction
… EMIG {emigration} : départ de son pays avec l’intention de résider ailleurs.
… ENDL {endowment} : dotation (sacrement de l’Eglise des Mormons reçu par un individu dans un temple).
… ENGA {engagement} : fiancailles
… EVEN {event} : événement intéressant à propos d’un individu, d’un groupe ou d’une organisation
… FAM {family} : association d’un homme, d’une femme et de leurs enfants selon la loi ou les coutumes, ou famille créée par la naissance d’un enfant d’un père et d’une mère biologiques.
… FAMC {family_child} : indique la famille à laquelle un enfant appartient
… FAMF {family_file} : nom d’un fichier de familles de l’Eglise des Mormons
… FAMS {family_spouse} : indique la famille dans laquelle l’individu est l’un des conjoints
… FCOM {first_communion} : cérémonie religieuse de première communion
… FILE {file} : entité de conservation d’informations classées pouvant être référencées.
… FORM {format} : nom donné à un format dans lequel des informations peuvent être transcrites
… GEDC {gedcom} : information sur l’utilisation de la norme GEDCOM dans un fichier.
… GIVN {given_name} : prénom
… GRAD {graduation} : diplôme ou certificat
… HEAD {header} : identification des informations du fichier GEDCOM
… HUSB {husband} : individu marié ou père d’un enfant
… IDNO {ident_number} : numéro d’identification d’une personne dans un fichier, une source ou un système externe
… IMMI {immigration} : arrivée dans un nouveau lieu avec intention d’y résider
… INDI {individual} : une personne
… LANG {language} : langage utilisé dans le fichier
… LEGA {legatee} : légataire
… MARB {marriage_bann} : publication des bans de mariage
… MARC {marr_contract} : contrat de mariage
… MARL {marr_license} : autorisation légale de mariage
… MARR {marriage} : création d’une famille
… MARS {marr_settlement} : convention, contrat avant mariage
… MEDI {media} : information sur le support des données stockées
… NAME {name} : mot ou ensemble de mots utilisés pour l’identification d’un individu, d’un titre, etc. Il faut utiliser plusieurs lignes NAME pour les personnes qui ont des noms multiples.
… NATI {nationality} : nationalité d’une personne
… NATU {naturalization} : obtention de la nationalité
… NCHI {children_count} : nombre d’enfants du parent (tous mariages confondus) s’il s’agit d’un individu ou de la famille s’il s’agit d’une famille.
… NICK {nickname} : surnom
… NMR {marriage_count} : nombre de mariages de la personne
… NOTE {note} : informations complémentaires ajoutées pour la compréhension des données
… NPFX {name_prefix} : texte ou titre qui apparait avant le nom d’une personne (Docteur, Général, Monseigneur…)
… NSFX {name_suffix} : texte qui apparait après le nom (Junior ou fils, par exemple)
… OBJE {object} : référence aux données utilisées comme description (généralement un enregistrement audio, une photo ou une vidéo)
… OCCU {occupation} : profession
… ORDI {ordinance} : sacrement religieux en général
… ORDN {ordination} : ordination religieuse
… PAGE {page} : numéro ou description de l’endroit où l’information se trouve dans un ouvrage référencé
… PEDI {pedigree} : Information relative à l’individu dans un tableau d’ascendance.
… PHON {phone} : numéro de téléphone
… PLAC {place} : lieu de l’événement
… POST {postal_code} : code postal
… PROB {probate} : validation d’un testament
… PROP {property} : biens et possessions
… PUBL {publication} : date et lieu de publication d’un ouvrage
… QUAY {quality_of-data} : degré de confiance à accorder à une information
… REFN {reference} : description ou numéro d’identification d’un fichier ou de tout autre objet pouvant être référencé
… RELA {relationship} : valeur du lien dans le contexte
… RELI {religion} : religion
… REPO {repository} : établissement ou personne dépositaire de l’information
… RESI {residence} : domicile
… RESN {restriction} : indicateur d’accès restreint ou interdit à une information
… RETI {retirement} : retraite
… RFN {rec_file_number} : numéro permanent affecté à un enregistrement pour l’identifier de manière unique dans un fichier
… RIN {rec_id_number} : numéro affecté à un enregistrement automatiquement par un système émetteur qui est utilisé pour identifier cet enregistrement dans les résultats produits par un système récepteur
… ROLE {role} : rôle tenu par un individu dans un événement
… SEX {sex} : sexe
… SLGC {sealing_child} : scellement d’un enfant à ses parents (cérémonie de l’Eglise des Mormons)
… SLGS {sealing_spouse} : scellement d’un mari et d’une femme (cérémonie de l’Eglise des Mormons)
… SOUR {source} : document d’origine ou source initiale de l’information
… SPFX {surn_prefix} : partie d’un nom de famille qui n’est pas indexée
… SSN {soc_sec_number} : numéro de sécurité sociale
… STAE {state} : état (division géographique ou juridictionnelle)
… STAT {status} : état (condition)
… SUBM {submitter} : individu ou organisation qui fournit les données généalogiques
… SUBN {submission} : ensemble de données à traiter
… SURN {surname} : nom de famille
… TEMP {temple} : nom ou code d’identification d’un temple de l’Eglise des Mormons
… TEXT {text} : texte exact provenant d’un document original
… TIME {time} : heures (entre 0 et 24), minutes et secondes séparées par les deux points (:). Secondes et centièmes de secondes sont optionnels.
… TITL {title} : description d’un ouvrage, comme le titre d’un livre; titre de noblesse ou titre honorifique pour un individu
… TRLR {trailer} : marque de fin d’un fichier GEDCOM
… TYPE {type} : définition complémentaire de la balise précédente.
… VERS {version} : indique la version d’un produit, d’un composant ou d’un ouvrage utilisé ou référencé
… WIFE {wife} : épouse
… WILL {will} : testament (voir aussi PROB)

 

En savoir plus sur la norme GEDCOM

La version GEDCOM 5.5.1 de la norme adoptée par l’Eglise des Mormons a été validée en novembre 2019.

La plus récente version de la norme adoptée par l’Eglise des Mormons est la version GEDCOM 7.0 qui a été validée en juin 2021.

La rubrique GEDCOM du site Wikipedia anglais est assez bien renseignée. C’est en anglais, mais la même rubrique du Wikipedia français est beaucoup moins riche.

 

Programmes utilitaires pour manipuler des fichiers GEDCOM

On peut trouver un bon nombre de programmes utilitaires qui manipulent des données GEDCOM. Ces utilitaires servent à:
— comparer des fichiers GEDCOM,
— créer des arbres ou des tableaux à partir de fichiers GEDCOM,
— visualiser, manipuler et imprimer des données GEDCOM,
— créer vos pages web à partir de vos données GEDCOM,
— convertir des données GEDCOM en fichier de format MS EXCEL ou MS ACCESS,
— faire des statistiques sur des fichiers GEDCOM.

 

Sur les sites suivants, vous trouverez des programmes utilitaires, le plus souvent gratuits, qui vous serviront à diverses manipulations de vos données généalogiques :
=> FamilySearch … [en français]
…. Liste de toutes les applications proposées par l’Eglise des Saints des Derniers Jours. (Web, Windows, Mac Os, IPhone, Ipad)
=> GenBox 3.7.1 … [en anglais]
…. Pour créer des arbres et des tableaux d’ancêtres à partir d’un fichier GEDCOM. (environ $30) (Windows)
=> GEDSplit … [en anglais]
…. Pour éclater des fichiers GEDCOM. (Windows)
=> Genviewer … [en anglais]
…. Programme de visualisation et d’analyse de fichiers au format GEDCOM, PAF, TMG, Legacy, RootsMagic ou Family Tree Maker (environ $20) (Windows)
=> TransGed … [en français]
…. Programme de génération de fichier GEDCOM à partir d’un fichier au format texte ou CSV (Windows)
=> FlashList … [en français]
…. Création d’une liste éclair et calcul des liens de parenté entre 2 individus (Windows)
=> Gedradio … [en français]
…. Analyse et validation des données d’un fichier GEDCOM (Windows)
=> Winancêtre … [en français]
…. Génération de représentations graphiques (arbres, roues, tableaux, statistiques, cartes de répartition géographique) à partir d’un fichier GEDCOM (environ 30 €) (Windows)

 

Créer des pages web à partir de fichiers GEDCOM

(conversion au format HTML, PHP, SQL ou XML)

=> Gedpage [en anglais]
…. (Windows, Mac) (environ $10)
=> Génàtoile [en français]
…. Programme de Jean-Baptiste Fahy écrit en Java (Linux, MacOs ou Windows)
=> GED2WEB [en anglais]
…. (Windows)
=> VisuGed [en français]
…. Programme de validation, de visualisation, de comparaison, de fusion, d’impression et de conversion de fichiers GEDCOM (gère les formats HTML, CSV, texte et liste éclair). (Windows)
=> Oxy-Gen [en français]
…. Programme de génération de données au format HTML, PHP, SQL, CSV ou XML à partir d’un fichier GEDCOM (Windows)
=> Gedail [en français]
…. Programme de génération de pages HTML d’un site web à partir de fichier gedcom (Windows)
=> Gedscape [en anglais]
…. Visualisation et publication web de données au format GEDCOM (environ $40) (Windows, Mac)