Archivo de autoridad común | |
---|---|
| |
establecimiento | 2012 |
Duración | 8,920,450 |
ubicación | Fráncfort del Meno |
EIIL | EN-588 |
operador | Biblioteca Nacional Alemana y otros |
sitio | https://gnd.network |
El Common Authority File ( GND ) es un archivo de autoridad para personas , corporaciones , congresos , geografías , encabezamientos de materia y títulos de obras , que se utiliza principalmente para catalogar literatura en bibliotecas, pero también se utiliza cada vez más en archivos, museos, proyectos y en aplicaciones web Está gestionado por la Biblioteca Nacional Alemana (DNB), todas las asociaciones de bibliotecas de lengua alemana , la base de datos de revistas(ZDB) y muchas otras instituciones. Los datos de autoridad facilitan la catalogación, ofrecen un acceso de búsqueda claro y la posibilidad de vincular diferentes recursos de información.
El 19 de abril de 2012, el GND reemplazó los archivos de autoridad previamente separados Archivo de nombre personal (PND), Archivo de entidad corporativa común (GKD), Archivo de autoridad de palabra clave (SWD) y el archivo de título de materia uniforme del Archivo de música alemán (DMA-EST expediente). Desde julio de 2014, los datos de autoridad se registran de acuerdo con las reglas de la RDA , que también son utilizadas por la Biblioteca del Congreso , entre otros . [1]
El archivo de autoridad conjunta se desarrolló entre 2009 y 2012 en un proyecto conjunto de la Biblioteca Nacional Alemana, las redes de bibliotecas en idioma alemán y la base de datos de revistas. El objetivo del proyecto era fusionar los archivos de autoridad GKD, PND y SWD que antes se gestionaban por separado y el archivo DMA-EST. Se debe implementar un formato de datos común y se deben armonizar las diferencias existentes en las regulaciones.
La creación de registros de autoridad solía basarse en diferentes conjuntos de reglas. Estas fueron las “ Reglas para la catalogación alfabética ” (RAK-WB y RAK-Musik) para la indexación formal y las “ Reglas para la catalogación de palabras clave ” (RSWK) para la indexación del contenido.. Las reglas inconsistentes para crear la designación preferida para la indexación formal y de contenido llevaron a conjuntos de datos redundantes en el GKD y el SWD, especialmente en el área de órganos corporativos, congresos y materiales geográficos. Por lo tanto, se desarrollaron reglas transitorias para el GND para los casos en que las reglas de indexación formal y de contenido se desvíen entre sí, lo que permite el uso conjunto de los registros de datos de autoridad. Las normas transitorias ya tienen en cuenta la normativa de la RDA ( Resource Description and Access ) en la medida de lo posible .
Los formatos de datos de los archivos de autoridad, tanto los formatos internos como los formatos de intercambio, también diferían considerablemente en algunos casos. El formato de intercambio GND se basa en la Autoridad MARC 21 . Al fusionar todos los registros de datos de autoridad en el GND, se podrían superar las diferencias de formato previamente existentes. Sin embargo, los conjuntos de datos paralelos existentes de los diferentes archivos de autoridad solo se pueden fusionar con el tiempo.
En el proyecto Virtual International Authority File (VIAF), el GND se combina virtualmente con otros archivos de autoridad para formar un archivo de autoridad internacional.
Los datos consisten en entidades y declaraciones sobre ellos. Cada entidad tiene un tipo de entidad y al menos un identificador.
Cada registro describe una entidad.
Los tipos de entidad enumerados aquí corresponden a los llamados tipos de registro ( tipo de registro de datos ) en las bibliotecas .
En el archivo de autoridad común, un número de identificación único (IDN o PPN; base para el Identificador Uniforme de Recursos en el sistema de producción), un término preferido estandarizado (anteriormente también: forma autorizada ), diferentes formas de nombres (sinónimos) y varios atributos descriptivos se registran para cada descripción de entidad . Si es posible, los atributos se almacenan como relaciones con otros registros de datos de autoridad, codificando el tipo de relación en cada caso. [2]Ejemplos de atributos relacionados son los lugares de nacimiento y muerte de las personas y sus ocupaciones. Para corporaciones, p. Se especifican las relaciones de predecesor y sucesor, pero también los superordinados administrativos. En el caso de los términos de materia, los términos genéricos y los términos relacionados están vinculados. Esto significa que también se puede encontrar literatura sobre temas relacionados al buscar en el catálogo de una biblioteca. Un procesamiento semántico y temático rico y preciso (dependiendo del tema también: orientado dogmáticamente ) de las entradas GND entre sí beneficia la calidad de la recuperación .
De esta manera, se crea una red semántica de conjuntos de datos relacionados ( linked data ), que es especialmente adecuada para su uso en la web, permite la navegación dentro del archivo de autoridad y, por lo tanto, mejora las opciones de búsqueda para los usuarios.
A fines de agosto de 2019, se suspendió el uso de oraciones Tn para nombres personales. [3] Un año después, a partir del 19 de junio de 2020, se eliminaron retrospectivamente los enlaces entre los registros Tn en los datos bibliográficos. La razón de esto fue la predominantemente mala calidad de las sentencias Tn. Muchos estaban solo en un nivel muy bajo de catalogación. A menudo no estaba claro a qué persona se podía atribuir un conjunto de datos, por lo que los datos no se desambiguaron. Había duplicados y enlaces incorrectos a datos bibliográficos. En lugar de enlaces, ahora solo hay cadenas de texto en los datos bibliográficos. Desde julio de 2020, los registros de nombres ya no forman parte del archivo de autoridad común. [4]
Además de los nombres personales, cada tipo de registro se puede diferenciar aún más especificando un código de entidad [5] . Por ejemplo, una entidad geográfica puede ser un estado o un edificio. Hay un total de seis tipos de entidades disponibles, que se dividen en alrededor de 50 subtipos.
código | definición [6] |
---|---|
GRAMO | geografía |
dar | Edificios y conjuntos de edificios, esculturas monumentales, monumentos, tumbas, etc. según RSWK §730.1 |
gif; gik | Estados miembros (siempre tienen doble codificación con "gik") |
gik | autoridades locales y unidades administrativas |
gil; gik | Países, estados (independientes) (siempre tienen doble codificación con "gik") |
Ginebra | Unidades geográficas naturales, unidades biogeográficas y paleográficas, nombres de subunidades geográficas con puntos cardinales o con otras expresiones según RSWK § 205, 1 y 2 |
gio | Elementos geográficos a pequeña escala dentro de una ubicación, con la excepción de edificios y conjuntos de edificios |
niña; gik | Principados imperiales espirituales (hasta 1803), unidades administrativas de la Iglesia Oriental (siempre tienen doble codificación con "gik") |
dar; gik | Unidades administrativas que, de acuerdo con la EH-G-03, reciben un término genérico instantáneo del término genérico de la unidad administrativa (siempre tienen doble codificación con "gik") |
giw | Fronteras, caminos, líneas |
gix | estraterrestrica |
giz | Todos los nombres geográficos que no se pueden asignar a ninguno de los otros subtipos de entidades, regiones y áreas de acuerdo con RSWK § 204a, incluidos los alrededores de ciudades y municipios individuales |
gxz | Lugares ficticios |
k | corporaciones |
kif | Empresas (desde enero de 2016) |
Kim | Cuerpos musicales (a enero de 2016) |
Kio | órganos de las autoridades locales |
dormir | Proyectos y planes y programas similares a proyectos |
kiv; kir | Unidades administrativas religiosas (p. ej., diócesis de la Iglesia Católica; excepción: unidades administrativas de la Iglesia Oriental, las unidades administrativas de la Iglesia Oriental están codificadas con "gir" y "gik") (siempre tienen doble codificación con "kir") (a partir de enero de 2016 ) |
kiz | Todas las demás entidades corporativas que no pertenecen a ningún otro tipo de entidad especial |
kxz | Entidades Ficticias |
pags | personas |
pif | Familias |
pico | Príncipes reinantes, miembros de las casas principescas gobernantes |
pepita | seudónimos |
pipí | seudónimos colectivos |
pizza | Nombres personales que no pertenecen a ningún otro tipo de entidad especial |
pxg | Dioses |
pxl | Figuras literarias, figuras legendarias |
px | fantasmas |
s | términos técnicos |
sab; Soz | Instrumentación musical (según RDA 6.15) (siempre tienen doble codificación con "saz") (a partir de enero de 2016) |
triste; Soz | Portadores de datos (según RDA 3.4.1.3 DA-CH) (siempre tienen doble codificación con "saz") |
seguro; Soz | Información del formulario sobre el tipo de contenido (según RDA 7.2.1.3 DA-CH) (siempre tienen doble codificación con "saz") |
decir; Soz | Género musical (según RDA 6.14.2.5.2 DA-CH) (siempre tienen doble codificación con "saz") (a partir de enero de 2016) |
Sam; Soz | Forma de salida musical (según RDA 7.20.1.3 DA-CH) (siempre tienen doble codificación con "saz") |
Soz | términos generales, i. h todos los encabezamientos de materia que no pertenecen a ningún otro tipo de entidad especial |
tú | etnográfico |
sif | Medios de transporte con nombres individuales |
ver | Eventos individuales históricos |
sorbo | Productos y marcas que no sean productos de software ("siw") |
hermana | Idiomas |
Oye | Grupos de personas que no son entidades corporativas |
sudoeste | productos de software |
Talla | Todos los hechos individuales que se registran como términos de materia y no se pueden asignar a ninguno de los otros subtipos de entidades, p. B. Competiciones |
slz | Letras, morfemas, palabras como objetos de investigación lingüística |
snz | Nomenclatura Biología – Química |
sxz | Términos ficticios |
szz | Todos los casos de duda para todas las entidades |
y | |
uiz | No corporaciones (solo en datos heredados) |
v | conferencias y eventos |
rivalizar | conferencias, eventos |
vif | Secuencias o series de conferencias, secuencias o series de eventos w |
w | fábricas |
otra vez | marcas de impresora |
cómo | expresión |
esposa | Versión de una obra musical (descontinuada a partir de julio de 2014) |
ingenio | obras de musica |
victoria | colecciones |
limpiar | características de procedencia |
saber | monumentos escritos |
ingenio | fábricas |
Cada entidad puede ser claramente identificada por al menos un identificador (GND-ID). Cada identificador consta de los caracteres del 0 al 9, una X y un guión. Un identificador para una entidad de tipo de entidad p consta de 9 o 10 caracteres, siempre comienza con un 1 seguido de 8 o 9 dígitos y termina con un carácter de verificación 0-9 o X.
Cada registro está asociado a un nivel de catalogación entre 1 y 6. Cuanto menor sea el número, mayor será el nivel de la entrada GND y mejor procesado será el conjunto de datos. El estándar al crear un nuevo registro de datos personales es inicialmente el nivel 3 (Tp3).
La designación preferida siempre se basa en las obras enumeradas en la " Lista de obras técnicas de referencia para el archivo de autoridad común ". [7] La denominación preferida de los términos de materia en el GND sigue el uso general tal como se usa en las enciclopedias ( Brockhaus , Meyer , alternativamente también Wikipedia) es detectable; excepcionalmente se utilizan términos de la jerga técnica. Los sinónimos se pueden incluir en las entradas como variantes o los llamados cuasi-sinónimos. Siempre que no haya suficientes títulos para un tema, primero se intenta expresar nuevos hechos combinando varios términos temáticos ya disponibles en una secuencia de palabras clave para evitar nuevas entradas en la medida de lo posible (el llamado control de descomposición). Esto mantiene la continuidad con las palabras clave de un tema en la literatura más antigua, de modo que se puede establecer una referencia a títulos más antiguos. Solo cuando la literatura sobre un tema ha alcanzado cierta extensión se introduce un nuevo término técnico. Si cambia el uso del idioma, se puede ajustar el término preferido.
Las cantidades se pueden encontrar en los informes anuales de la DNB y en los extractos de datos de la GND [8] .
El archivo de autoridad común contiene alrededor de 8,9 millones de registros (al 13 de junio de 2021) de los siguientes tipos de entidades :
tipo de entidad / fecha | fuente | personas (individualizadas) |
Nombres personales (no individualizados) |
Personas y nombres personales (total) |
corporaciones | conferencias y eventos |
geografía | términos técnicos | fábricas | total |
---|---|---|---|---|---|---|---|---|---|---|
código de entidad | -- | pags | norte | -- | k | v | GRAMO | s | w | -- |
Junio del 2013 | ? | 2,882,000 | 4.628.000 | (7.510.000) | 1,172,000 | 587,000 | 293,000 | 202,000 | 193,000 | (9,957,000) |
2015 | Informe Anual [9] | sin información | sin información | 8,669,790 | 1,240,852 | 619,610 | 289,449 | 205,586 | 244,480 | 11,269,767 |
2016 | Informe Anual [10] | sin información | sin información | 10,546,959 | 1,498,606 | 769,067 | 295,027 | 207,149 | 287,204 | 13.604.012 |
2017 | Informe Anual [11] | sin información | sin información | 11,551,274 | 1,493,823 | 786,180 | 300,138 | 209.003 | 331,310 | 14.671.728 |
2018 | Informe Anual [12] | sin información | sin información | 12.032.087 | 1,487,938 | 803,612 | 305,543 | 211,339 | 367,574 | 15.208.093 |
2019 | Informe Anual [13] | sin información | sin información | 12,265,826 | 1,490,830 | 826,579 | 310,860 | 212,775 | 405,899 | 15,512,769 |
febrero 2020 | SUD [14] | 5,251,171 | 7,046,133 | 12,297,304 | 1,491,072 | 829,548 | 311,357 | 212,895 | 410,736 | 15.552.912 |
junio 2020 | SUD [15] | 5,350,953 | abandonó | (5,350,953) | 1,491,358 | 836,410 | 313,058 | 213,257 | 425,718 | 8,630,754 |
13 de octubre de 2020 | SUD [16] | 5,421,947 | abandonó | (5.421.947) | 1,490,757 | 842,725 | 314,492 | 213,528 | 442.181 | 8,725,630 |
2020 | Informe Anual [17] | 5,467,413 | sin información | sin información | 1,493,057 | 846,449 | 315,389 | 213,655 | 451,414 | 8,787,377 |
13 de febrero de 2021 | SUD [18] | 5,496,766 | abandonó | (5.496.766) | 1,495,527 | 848,846 | 315,924 | 213,779 | 456,893 | 8,827,735 |
13 de junio de 2021 | SUD [19] | 5,574,687 | abandonó | (5.574.687) | 1,501,942 | 854,637 | 317,093 | 203,371 | 468,720 | 8,920,450 |
23 de octubre de 2021 | SUD [20] | 5,650,830 | abandonó | (5.650.830) | 1,507,546 | 854,539 | 318,392 | 203.801 | 479,558 | 9,014,666 |
A partir del 13 de junio de 2021, hay 465 790 registros de desviación publicados en formato RDF (JSON-LD) en open.dnb.de/opendata. Esto significa que algunos registros de datos se pueden referenciar a través de varios identificadores GND.
fecha | número | anotación |
---|---|---|
13/04/2021 | 461,335 | |
13/06/2021 | 465,790 | |
13/11/2021 | 472,485 | GND, conjuntos de desviación sin Tu |
Al 13 de junio de 2021 a las 13:20 UTC, los archivos "authorities_lds" contienen 163 131 042 triples en 8 920 450 registros. [21]
tiempo | registros | triple |
---|---|---|
13/06/2021 13:20 UTC | 8,920,450 | 163.131.042 |
2021-10-13 12:20 UTC | 9,014,666 | 165.639.860 |
El archivo de autoridad conjunta se conserva en la Biblioteca Nacional Alemana. Las redes de bibliotecas importaron el stock básico GND a sus sistemas de red una vez y desde entonces han obtenido las actualizaciones del archivo de autoridad a través del proceso OAI . El GND no solo es editado y ampliado por bibliotecas, sino también por archivos (hasta ahora principalmente por archivos científicos y literarios), museos y editores de obras de referencia. La colaboración se lleva a cabo a través de asociaciones de bibliotecarios o previa consulta con la Biblioteca Nacional Alemana. El uso por parte de los archivos estatales y municipales recién comienza (a partir de 2015).
Los datos de autoridad GND están disponibles de forma gratuita en el sitio web de DNB en los formatos MARC 21 Autoridad, MARC21-xml y RDFxml bajo licencia CC0 1.0 .
En diciembre de 2012, se inició un proyecto de cooperación entre la Biblioteca Nacional Alemana (DNB) y el Instituto Alemán de Cine (DIF) bajo el nombre de Integración interinstitucional de datos normativos (IN2N). El objetivo del proyecto, financiado por la Fundación Alemana de Investigación (DFG), es apoyar a las instituciones no bibliotecarias en el uso del GND e involucrarlas en la indexación. [22] Entre otras cosas, como parte del proyecto, los conjuntos de datos de filmportal.de se compararon con los artículos personales de Wikipedia . [23]
A finales de 2014 se importaron los datos estándar del DIF al GND. En los meses anteriores ya se habían trasladado al GND datos del Instituto Iberoamericano (Berlín) y del Centro de Investigación de Europa del Este de la Universidad de Bremen, entre otros. Desde el 6 de mayo de 2016, los wikipedistas que han participado en la formación adecuada han podido crear datos de autoridad para las personas que utilizan el "formulario web GND". El identificador de biblioteca correspondiente es Wikimedia Alemania (DE-B1592).