Fichier d'autorité commun | |
---|---|
| |
fondateur | 2012 |
Durée | 8 920 450 |
emplacement | Francfort-sur-le-Main |
EIIL | FR-588 |
opérateur | Bibliothèque nationale allemande et autres |
placer | https://gnd.network |
Le fichier d'autorité commun ( GND ) est un fichier d'autorité pour les personnes , les sociétés , les congrès , les géographies , les vedettes- matière et les titres de travail , qui est principalement utilisé pour cataloguer la littérature dans les bibliothèques, mais est également de plus en plus utilisé par les archives, les musées, les projets et dans applications Web . Il est géré par la Bibliothèque nationale allemande (DNB), toutes les associations de bibliothèques de langue allemande , la base de données des revues(ZDB) et de nombreuses autres institutions. Les données d'autorité facilitent le catalogage, offrent des points d'accès de recherche clairs et la possibilité de relier différentes ressources d'information.
Le 19 avril 2012, le GND a remplacé les fichiers d'autorité précédemment séparés Personal Name File (PND), Common Corporate Body File (GKD), Keyword Authority File (SWD) et le fichier de titres de sujet uniforme des archives musicales allemandes (DMA-EST dossier). Depuis juillet 2014, les données d'autorité sont enregistrées selon les règles RDA , qui sont également utilisées par la Bibliothèque du Congrès , entre autres . [1]
Le fichier d'autorité commun a été développé de 2009 à 2012 dans le cadre d'un projet conjoint de la Bibliothèque nationale allemande, des réseaux de bibliothèques de langue allemande et de la base de données des revues. L'objectif du projet était de fusionner les fichiers d'autorité GKD, PND et SWD précédemment gérés séparément et le fichier DMA-EST. Un format de données commun devrait être mis en œuvre et les différences existantes dans les réglementations devraient être harmonisées.
La création de notices d'autorité était autrefois basée sur différents ensembles de règles. Il s'agissait des « Rules for Alphabetical Cataloging » (RAK-WB et RAK-Musik) pour l'indexation formelle et des « Rules for Keyword Cataloging » (RSWK) pour l'indexation du contenu.. Les règles incohérentes de création de la désignation préférée pour l'indexation formelle et de contenu ont conduit à des ensembles de données redondants dans le GKD et le SWD, en particulier dans le domaine des collectivités, des congrès et des matériaux géographiques. Par conséquent, des règles transitoires ont été élaborées pour le GND pour les cas où les règles d'indexation formelle et de contenu s'écartent l'une de l'autre, ce qui permet l'utilisation conjointe des enregistrements de données d'autorité. Les règles transitoires tiennent déjà compte autant que possible des réglementations de la RDA ( Ressource Description and Access ) .
Les formats de données des fichiers d'autorité, tant les formats internes que les formats d'échange, différaient également considérablement dans certains cas. Le format d'échange GND est basé sur MARC 21 Authority. En fusionnant tous les enregistrements de données d'autorité dans le GND, les différences de format existantes pourraient être surmontées. Cependant, les ensembles de données parallèles existants provenant des différents fichiers d'autorité ne peuvent être fusionnés qu'au fil du temps.
Dans le projet Virtual International Authority File (VIAF), le GND est virtuellement combiné avec d'autres fichiers d'autorité pour former un fichier d'autorité international.
Les données sont constituées d'entités et de déclarations à leur sujet. Chaque entité a un type d'entité et au moins un identifiant.
Chaque enregistrement décrit une entité.
Les types d'entités répertoriés ici correspondent à ce que l'on appelle des types d'enregistrement ( type d'enregistrement de données ) dans les bibliothèques .
Dans le fichier d'autorité commun, un numéro d'identification unique (IDN ou PPN ; base de l' Uniform Resource Identifier dans le système de production), un terme préféré normalisé (anciennement également : forme autorisée ), différentes formes de noms (synonymes) et divers attributs descriptifs sont enregistrées pour chaque description d'entité . Si possible, les attributs sont stockés sous forme de relations avec d'autres enregistrements de données d'autorité, le type de relation étant codé dans chaque cas. [2]Des exemples d'attributs connexes sont les lieux de naissance et de décès des personnes et leurs professions. Pour les entreprises, par ex. Les relations de prédécesseur et de successeur, mais aussi les superordonnés administratifs sont spécifiés. Dans le cas des termes de sujet, les termes génériques et les termes apparentés sont liés. Cela signifie que la littérature sur des sujets connexes peut également être trouvée lors d'une recherche dans un catalogue de bibliothèque. Un traitement sémantique et thématique riche et précis (selon le sujet aussi : orienté dogmatiquement ) des entrées GND les unes par rapport aux autres profite à la qualité de la recherche .
De cette manière, un réseau sémantique d'ensembles de données connexes ( données liées ) est créé, qui est particulièrement adapté à une utilisation sur le Web, permet la navigation dans le fichier d'autorité et améliore ainsi les options de recherche pour les utilisateurs.
Fin août 2019, l'utilisation des phrases Tn pour les noms personnels a été abandonnée. [3] Un an plus tard, à compter du 19 juin 2020, les liens entre les notices Tn dans les données bibliographiques ont été rétrospectivement supprimés. La raison en était la qualité généralement médiocre des phrases Tn. Beaucoup n'étaient qu'à un très bas niveau de catalogage. Il était souvent difficile de savoir à quelle personne un ensemble de données pouvait être attribué, de sorte que les données n'étaient pas désambiguïsées. Il y avait des doublons et des liens incorrects vers des données bibliographiques. Au lieu de liens, il n'y a plus que des chaînes de texte dans les données bibliographiques. Depuis juillet 2020, les notices nominatives ne font plus partie du fichier d'autorité commun. [4]
Outre les noms personnels, chaque type d'enregistrement peut être davantage différencié en spécifiant un code d'entité [5] . Par exemple, une entité géographique peut être un état ou un bâtiment. Un total de six types d'entités sont disponibles, qui sont divisés en environ 50 sous-types.
code | définition [6] |
---|---|
g | géographie |
donner | Bâtiments et ensembles de bâtiments, sculptures monumentales, monuments, tombes, etc. selon RSWK §730.1 |
GIF ; gik | États membres (ils sont toujours codés en double avec "gik") |
gik | collectivités locales et unités administratives |
gil; gik | Pays, états (indépendants) (ils sont toujours codés en double avec "gik") |
Gin | Unités géographiques naturelles, unités biogéographiques et paléographiques, noms de sous-unités géographiques avec des points cardinaux ou avec d'autres expressions selon RSWK § 205, 1 et 2 |
gio | Géographie à petite échelle dans un lieu, à l'exception des bâtiments et des ensembles de bâtiments |
gir ; gik | Principautés impériales spirituelles (jusqu'en 1803), unités administratives de l'Église d'Orient (elles sont toujours codées en double avec "gik") |
donner; gik | Unités administratives qui, selon EH-G-03, reçoivent un terme générique instantané à partir du terme générique de l'unité administrative (elles sont toujours codées en double avec "gik") |
donner | Bordures, chemins, lignes |
gix | estraterrestre |
gadget | Tous les noms géographiques qui ne peuvent être attribués à aucun des autres sous-types d'entités, régions et zones selon RSWK § 204a, y compris les environs des villes et municipalités individuelles |
gxz | Lieux fictifs |
k | sociétés |
kif | Entreprises (à partir de janvier 2016) |
Kim | Corps musicaux (à partir de janvier 2016) |
kio | organes des collectivités locales |
kip | Projets et plans et programmes assimilables à des projets |
kiv; kir | Unités administratives religieuses (par exemple, les diocèses de l'Église catholique ; exception : les unités administratives de l'Église orientale, les unités administratives de l'Église orientale sont encodées avec « gir » et « gik ») (elles sont toujours codées en double avec « kir ») (depuis janvier 2016 ) |
kiz | Toutes les autres personnes morales qui n'appartiennent à aucun autre type d'entité spéciale |
kxz | Entités fictives |
p | personnes |
pif | Familles |
pique | Princes régnants, membres des maisons princières dirigeantes |
pépin | pseudonymes |
pipi | pseudonymes collectifs |
pizza | Les noms personnels qui n'appartiennent à aucun autre type d'entité spéciale |
pxg | dieux |
pixels | Figures littéraires, figures légendaires |
pixels | des fantômes |
s | termes techniques |
sab; soz | Instrumentation musicale (selon RDA 6.15) (ils sont toujours codés en double avec "saz") (à partir de janvier 2016) |
triste; soz | Supports de données (selon RDA 3.4.1.3 DA-CH) (ils sont toujours codés en double avec "saz") |
sûr; soz | Formulaire d'informations sur le type de contenu (selon RDA 7.2.1.3 DA-CH) (ils sont toujours codés en double avec "saz") |
dire; soz | Genre musical (selon RDA 6.14.2.5.2 DA-CH) (ils sont toujours codés en double avec "saz") (à partir de janvier 2016) |
sam; soz | Forme de sortie musicale (selon RDA 7.20.1.3 DA-CH) (elles sont toujours codées en double avec "saz") |
soz | termes généraux, i. H toutes les vedettes-matière qui n'appartiennent à aucun autre type d'entité spéciale |
tu | ethnographique |
sif | Moyens de transport avec des noms individuels |
voir | Événements individuels historiques |
siroter | Produits et noms de marque autres que les produits logiciels (« siw ») |
soeurette | Langues |
hé | Groupes de personnes qui ne sont pas des personnes morales |
sw | produits logiciels |
Taille | Tous les faits individuels qui sont enregistrés en tant que termes de sujet et ne peuvent être attribués à aucun des autres sous-types d'entité, par ex. B. Compétitions |
slz | Lettres, morphèmes, mots comme objets d'investigation linguistique |
snz | Nomenclature Biologie – Chimie |
sxz | Termes fictifs |
szz | Tous les cas de doute pour toutes les entités |
et | |
uiz | Non-sociétés (uniquement dans les anciennes données) |
v | conférences et événements |
vie | conférences, événements |
vif | Séquences ou séries de conférences, séquences ou séries d'événements w |
w | des usines |
encore | marques d'imprimante |
comment | expression |
femme | Version d'une œuvre musicale (abandonnée depuis juillet 2014) |
wim | oeuvres de musique |
gagner | collections |
essuyer | caractéristiques de provenance |
connaître | monuments écrits |
esprit | des usines |
Chaque entité peut être clairement identifiée par au moins un identifiant (GND-ID). Chaque identifiant est composé des caractères 0 à 9, X et d'un trait d'union. Un identifiant pour une entité de type d'entité p se compose de 9 ou 10 caractères, il commence toujours par un 1 suivi de 8 ou 9 chiffres et se termine par un caractère de contrôle 0-9 ou X.
Chaque notice est associée à un niveau de catalogage compris entre 1 et 6. Plus le nombre est bas, plus le niveau de l'entrée GND est élevé et mieux l'ensemble de données est traité. La norme lors de la création d'un nouveau dossier de données personnelles est initialement le niveau 3 (Tp3).
La désignation privilégiée est toujours basée sur les ouvrages répertoriés dans la « Liste des ouvrages techniques de référence pour le fichier d'autorité commun ». [7] La dénomination préférée des termes de sujet dans le GND suit l'usage général tel qu'il est utilisé dans les encyclopédies ( Brockhaus , Meyer , alternativement aussi Wikipedia) est détectable ; dans des cas exceptionnels, des termes issus du jargon technique sont utilisés. Les synonymes peuvent être inclus dans les entrées en tant que variantes ou quasi-synonymes. Tant qu'il n'y a pas assez de titres pour un sujet, on essaie d'abord d'exprimer de nouveaux faits en combinant plusieurs termes de sujet déjà disponibles dans une séquence de mots-clés afin d'éviter autant que possible de nouvelles entrées (ce qu'on appelle le contrôle de décomposition). Cela maintient la continuité avec le mot-clé d'un sujet dans la littérature ancienne, de sorte qu'une référence à des titres plus anciens peut être établie. Ce n'est que lorsque la littérature sur un sujet a atteint une certaine étendue qu'un nouveau terme technique est introduit. Si l'utilisation de la langue change, le terme préféré peut être ajusté.
Les quantités peuvent être trouvées dans les rapports annuels de la DNB et les extraits de données de la GND [8] .
Le fichier d'autorité commun contient environ 8,9 millions d'enregistrements (au 13 juin 2021) des types d' entités suivants :
type d'entité / date | la source | personnes (individualisé) |
Noms personnels (non individualisés) |
Personnes et noms personnels (total) |
sociétés | conférences et événements |
géographie | termes techniques | des usines | total |
---|---|---|---|---|---|---|---|---|---|---|
code d'entité | -- | p | n | -- | k | v | g | s | w | -- |
Juin 2013 | ? | 2 882 000 | 4 628 000 | (7 510 000) | 1 172 000 | 587 000 | 293 000 | 202 000 | 193 000 | (9 957 000) |
2015 | Rapport annuel [9] | aucune information | aucune information | 8 669 790 | 1 240 852 | 619 610 | 289 449 | 205 586 | 244 480 | 11 269 767 |
2016 | Rapport annuel [10] | aucune information | aucune information | 10 546 959 | 1 498 606 | 769 067 | 295 027 | 207 149 | 287 204 | 13.604.012 |
2017 | Rapport annuel [11] | aucune information | aucune information | 11 551 274 | 1 493 823 | 786 180 | 300 138 | 209.003 | 331 310 | 14 671 728 |
2018 | Rapport annuel [12] | aucune information | aucune information | 12.032.087 | 1 487 938 | 803 612 | 305 543 | 211 339 | 367 574 | 15.208.093 |
2019 | Rapport annuel [13] | aucune information | aucune information | 12 265 826 | 1 490 830 | 826 579 | 310 860 | 212 775 | 405 899 | 15 512 769 |
Février 2020 | SDJ [14] | 5 251 171 | 7 046 133 | 12 297 304 | 1 491 072 | 829 548 | 311 357 | 212 895 | 410 736 | 15 552 912 |
Juin 2020 | SDJ [15] | 5 350 953 | abandonné | (5 350 953) | 1 491 358 | 836 410 | 313 058 | 213 257 | 425 718 | 8 630 754 |
13 octobre 2020 | SDJ [16] | 5 421 947 | abandonné | (5 421 947) | 1 490 757 | 842 725 | 314 492 | 213 528 | 442.181 | 8 725 630 |
2020 | Rapport annuel [17] | 5 467 413 | aucune information | aucune information | 1 493 057 | 846 449 | 315 389 | 213 655 | 451 414 | 8 787 377 |
13 février 2021 | SDJ [18] | 5 496 766 | abandonné | (5 496 766) | 1 495 527 | 848 846 | 315 924 | 213 779 | 456 893 | 8 827 735 |
13 juin 2021 | SDJ [19] | 5 574 687 | abandonné | (5 574 687) | 1 501 942 | 854 637 | 317 093 | 203 371 | 468 720 | 8 920 450 |
23 octobre 2021 | SDJ [20] | 5 650 830 | abandonné | (5 650 830) | 1 507 546 | 854 539 | 318 392 | 203.801 | 479 558 | 9 014 666 |
Au 13 juin 2021, 465 790 enregistrements de déviation étaient publiés au format RDF (JSON-LD) sur open.dnb.de/opendata. Cela signifie que certains enregistrements de données peuvent être référencés via plusieurs identifiants GND.
Date | Numéro | annotation |
---|---|---|
13/04/2021 | 461 335 | |
13/06/2021 | 465 790 | |
13/11/2021 | 472 485 | GND, ensembles de déviation sans Tu |
Au 13 juin 2021 à 13h20 UTC, les fichiers "authorities_lds" contiennent 163 131 042 triplets dans 8 920 450 enregistrements. [21]
temps | enregistrements | tripler |
---|---|---|
13/06/2021 13:20 UTC | 8 920 450 | 163.131.042 |
2021-10-13 12 h 20 UTC | 9 014 666 | 165 639 860 |
Le fichier d'autorité commun est conservé à la Bibliothèque nationale allemande. Les réseaux de bibliothèques ont importé le stock de base GND dans leurs systèmes de réseau une fois et ont depuis obtenu les mises à jour du fichier d'autorité via le processus OAI . Le GND n'est pas seulement édité et enrichi par les bibliothèques, mais aussi par les archives (jusqu'à présent principalement par les archives scientifiques et littéraires), les musées et les éditeurs d'ouvrages de référence. La collaboration s'effectue soit par le biais d'associations de bibliothèques, soit après consultation de la Bibliothèque nationale allemande. L'utilisation par les archives nationales et municipales ne fait que commencer (à partir de 2015).
Les données de l'autorité GND sont disponibles gratuitement sur le site de la DNB aux formats MARC 21 Authority, MARC21-xml et RDFxml sous licence CC0 1.0 .
En décembre 2012, un projet de coopération entre la Bibliothèque nationale allemande (DNB) et l' Institut allemand du film (DIF) a été lancé sous le nom d'Intégration interinstitutionnelle des données normatives (IN2N). L'objectif du projet, financé par la Fondation allemande pour la recherche (DFG), est de soutenir les institutions non bibliothécaires dans l'utilisation du GND et de les impliquer dans l'indexation. [22] Entre autres choses, dans le cadre du projet, les ensembles de données de filmportal.de ont été comparés avec les articles personnels de Wikipedia . [23]
Fin 2014, les données standard du DIF ont été importées dans le GND. Dans les mois précédents, des données de l' Institut ibéro-américain (Berlin) et du Centre de recherche pour l'Europe de l'Est de l'Université de Brême, entre autres, avaient déjà été transférées au GND. Depuis le 6 mai 2016, les Wikipédiens ayant suivi une formation adaptée peuvent créer des données d'autorité pour les particuliers via le « formulaire web GND ». L'identifiant de bibliothèque correspondant est Wikimedia Germany (DE-B1592).