File di autorizzazione comune | |
---|---|
| |
fondazione | 2012 |
Durata | 8.920.450 |
Posizione | Francoforte sul Meno |
ISIL | EN-588 |
operatore | Biblioteca nazionale tedesca e altri |
luogo | https://gnd.network |
Il Common Authority File ( GND ) è un file di autorità per persone , aziende , congressi , materiali geografici , intestazioni di argomenti e titoli di opere , che viene utilizzato principalmente per catalogare la letteratura nelle biblioteche, ma è anche sempre più utilizzato da archivi, musei, progetti e in applicazioni web . È gestito dalla Biblioteca nazionale tedesca (DNB), da tutte le associazioni di biblioteche di lingua tedesca , dal database del giornale(ZDB) e numerose altre istituzioni. I dati dell'autorità facilitano la catalogazione, offrono chiari punti di accesso alla ricerca e la possibilità di collegare diverse risorse informative.
Il 19 aprile 2012, il GND ha sostituito i file di autorità precedentemente separati Personal Name File (PND), Common Corporate Body File (GKD), Keyword Authority File (SWD) e il file del titolo del soggetto uniforme del German Music Archive (DMA-EST file). Da luglio 2014, i dati dell'autorità sono stati registrati secondo le regole RDA , utilizzate tra l'altro anche dalla Library of Congress . [1]
L'authority file comune è stato sviluppato dal 2009 al 2012 in un progetto congiunto della Biblioteca nazionale tedesca, delle reti di biblioteche di lingua tedesca e del database del giornale. Lo scopo del progetto era unire i file di autorità GKD, PND e SWD precedentemente gestiti separatamente e il file DMA-EST. Dovrebbe essere implementato un formato di dati comune e dovrebbero essere armonizzate le differenze esistenti nelle normative.
La creazione di record di autorità si basava su diversi insiemi di regole. Queste erano le " Regole per la catalogazione alfabetica " (RAK-WB e RAK-Musik) per l'indicizzazione formale e le " Regole per la catalogazione delle parole chiave " (RSWK) per l'indicizzazione del contenuto. Le regole incoerenti per la creazione della designazione preferita per l'indicizzazione formale e dei contenuti hanno portato a set di dati ridondanti nel GKD e nel SWD, soprattutto nell'area degli organi aziendali, dei congressi e dei materiali geografici. Pertanto, sono state sviluppate regole transitorie per il GND per i casi in cui le regole di indicizzazione formale e di contenuto si discostano l'una dall'altra, il che consente l'uso congiunto dei record di dati dell'autorità. Le regole transitorie tengono già conto , per quanto possibile , delle norme della RDA ( Descrizione e Accesso delle Risorse ) .
Anche i formati dei dati degli authority file, sia i formati interni che i formati di scambio, differivano notevolmente in alcuni casi. Il formato di scambio GND si basa sull'Autorità MARC 21 . Unendo tutti i record di dati dell'autorità nel GND, è stato possibile superare le differenze di formato precedentemente esistenti. Tuttavia, i set di dati paralleli esistenti provenienti dai diversi file di autorità possono essere uniti solo nel tempo.
Nel progetto VIAF ( Virtual International Authority File ), il GND è virtualmente combinato con altri authority file per formare un authority file internazionale.
I dati sono costituiti da entità e dichiarazioni su di loro. Ogni entità ha un tipo di entità e almeno un identificatore.
Ogni record descrive un'entità.
I tipi di entità qui elencati corrispondono ai cosiddetti tipi di record ( tipo di record di dati ) nelle librerie .
Nell'authority file comune, un numero di identificazione univoco (IDN o PPN; base per l' Uniform Resource Identifier nel sistema di produzione), un termine preferito standardizzato (ex anche: modulo autorizzato ), diverse forme di nomi (sinonimi) e vari attributi descrittivi sono registrati per ciascuna descrizione dell'entità . Se possibile, gli attributi vengono archiviati come relazioni con altri record di dati di autorità, con il tipo di relazione codificato in ciascun caso. [2]Esempi di attributi correlati sono i luoghi di nascita e morte delle persone e le loro occupazioni. Per le aziende, ad es. Sono specificati i rapporti di predecessore e successore, ma anche i superiori amministrativi. Nel caso di termini oggetto, termini generici e termini correlati sono collegati. Ciò significa che la letteratura su argomenti correlati può essere trovata anche durante la ricerca nel catalogo di una biblioteca. Un'elaborazione semantica e tematica ricca e accurata (a seconda dell'argomento anche: orientata dogmaticamente ) delle voci GND tra loro giova alla qualità del reperimento .
In questo modo viene creata una rete semantica di data set correlati ( linked data ), particolarmente adatta per l'utilizzo sul web, consente la navigazione all'interno dell'authority file e migliora così le opzioni di ricerca per gli utenti.
A fine agosto 2019 è stato interrotto l'uso di Tn frasi per i nomi di persona. [3] Un anno dopo, a partire dal 19 giugno 2020, i collegamenti tra i record Tn nei dati bibliografici sono stati cancellati retrospettivamente. La ragione di ciò era la qualità prevalentemente scarsa delle sentenze Tn. Molti erano solo a un livello molto basso di catalogazione. Spesso non era chiaro a quale persona potesse essere attribuito un set di dati, quindi i dati non erano disambiguati. C'erano duplicati e collegamenti errati ai dati bibliografici. Al posto dei collegamenti, ora nei dati bibliografici sono presenti solo stringhe di testo. Da luglio 2020, i record dei nomi non fanno più parte dell'authority file comune. [4]
A parte i nomi personali, ogni tipo di record può essere ulteriormente differenziato specificando un codice entità [5] . Ad esempio, un'entità geografica può essere uno stato o un edificio. Sono disponibili in totale sei tipi di entità, suddivisi in circa 50 sottotipi.
codice | definizione [6] |
---|---|
G | geografia |
dare | Edifici e complessi edilizi, sculture monumentali, monumenti, tombe, ecc. secondo RSWK §730.1 |
gif; gik | Stati membri (sono sempre codificati con "gik") |
gik | enti locali e unità amministrative |
gil; gik | Paesi, stati (indipendenti) (sono sempre doppiati con "gik") |
Gin | Unità geografiche naturali, unità biogeografiche e paleografiche, nomi di sottounità geografiche con punti cardinali o con altre espressioni secondo RSWK § 205, 1 e 2 |
gio | Geografie su piccola scala all'interno di un luogo, ad eccezione di edifici e complessi edilizi |
ragazza; gik | Principati spirituali imperiali (fino al 1803), unità amministrative della Chiesa d'Oriente (sono sempre doppiati con "gik") |
dare; gik | Unità amministrative che, secondo EH-G-03, ricevono un termine generico istantaneo dal termine generico dell'unità amministrativa (sono sempre doppiate con "gik") |
giw | Confini, percorsi, linee |
gix | estraterrestre |
giz | Tutti i nomi geografici che non possono essere assegnati a nessuno degli altri sottotipi di entità, regioni e aree secondo RSWK § 204a, compresi i dintorni di singole città e comuni |
gxz | Luoghi di fantasia |
K | corporazioni |
kif | Aziende (da gennaio 2016) |
Kim | Corpi musicali (a partire da gennaio 2016) |
kio | organi degli enti locali |
kip | Progetti e piani e programmi simili a progetti |
kiv; Kir | Unità amministrative religiose (ad es. diocesi della Chiesa cattolica; eccezione: le unità amministrative della Chiesa orientale, le unità amministrative della Chiesa orientale sono codificate con "gir" e "gik") (sono sempre doppiamente codificate con "kir") (a partire da gennaio 2016 ) |
kiz | Tutti gli altri organi sociali che non appartengono a nessun altro tipo di entità speciale |
kxz | Entità immaginarie |
p | persone |
pif | Famiglie |
pik | Principi regnanti, membri di case principesche regnanti |
pip | pseudonimi |
fare pipì | pseudonimi collettivi |
piz | Nomi personali che non appartengono a nessun altro tipo di entità speciale |
pxg | di Dio |
pxl | Personaggi letterari, personaggi leggendari |
px | fantasmi |
S | termini tecnici |
sab; soz | Strumentazione musicale (secondo RDA 6.15) (sono sempre doppiati con "saz") (a partire da gennaio 2016) |
triste; soz | Supporti dati (secondo RDA 3.4.1.3 DA-CH) (sono sempre a doppia codifica con "saz") |
sicuro; soz | Modulo informazioni sul tipo di contenuto (secondo RDA 7.2.1.3 DA-CH) (sono sempre doppiati con "saz") |
dire; soz | Genere musicale (secondo RDA 6.14.2.5.2 DA-CH) (sono sempre a doppia codifica con "saz") (a partire da gennaio 2016) |
sam; soz | Modulo di output musicale (secondo RDA 7.20.1.3 DA-CH) (sono sempre a doppia codifica con "saz") |
soz | termini generali, i. H. tutte le intestazioni di soggetto che non appartengono a nessun altro tipo di entità speciale |
voi | etnografica |
sif | Mezzi di trasporto con nomi individuali |
vedere | Singoli eventi storici |
sorso | Prodotti e marchi diversi dai prodotti software ("siw") |
sorella | Le lingue |
Hey | Gruppi di persone che non sono enti |
sv | prodotti software |
taglia | Tutti i singoli fatti che sono registrati come termini soggettivi e non possono essere assegnati a nessuno degli altri sottotipi di entità, ad es. B. Concorsi |
slz | Lettere, morfemi, parole come oggetti di indagine linguistica |
snz | Nomenclatura Biologia – Chimica |
sxz | Termini di fantasia |
szz | Tutti i casi di dubbio per tutte le entità |
e | |
uiz | Non società (solo nei dati legacy) |
v | convegni ed eventi |
gareggiare | conferenze, eventi |
vif | Sequenze o serie di conferenze, sequenze o serie di eventi w |
w | fabbriche |
ancora | segni di stampa |
come | espressione |
moglie | Versione di un'opera musicale (fuori produzione a partire da luglio 2014) |
wim | opere di musica |
vincita | collezioni |
pulire | caratteristiche di provenienza |
sapere | monumenti scritti |
spirito | fabbriche |
Ogni entità può essere chiaramente identificata da almeno un identificatore (GND-ID). Ogni identificatore è costituito dai caratteri da 0 a 9, X e un trattino. Un identificatore per un'entità di tipo entità p è composto da 9 o 10 caratteri, inizia sempre con un 1 seguito da 8 o 9 cifre e termina con un carattere di controllo 0-9 o X.
Ad ogni record è associato un livello di catalogazione compreso tra 1 e 6. Più basso è il numero, maggiore è il livello della voce GND e migliore è l'elaborazione del set di dati. Lo standard per la creazione di un nuovo record di dati personali è inizialmente il livello 3 (Tp3).
La designazione preferita è sempre basata sulle opere elencate nell'" Elenco delle opere di riferimento tecnico per il Common Authority File ". [7] La denominazione preferita dei termini soggetto nel GND segue l'uso generale in quanto viene utilizzata nelle enciclopedie ( Brockhaus , Meyer , in alternativa anche Wikipedia) è rilevabile; in casi eccezionali si utilizzano termini del gergo tecnico. I sinonimi possono essere inclusi nelle voci come varianti o cosiddetti quasi-sinonimi. Finché non ci sono titoli sufficienti per un argomento, si tenta dapprima di esprimere fatti nuovi combinando più termini soggetto già disponibili in una sequenza di parole chiave in modo da evitare il più possibile nuovi ingressi (cd controllo di scomposizione). Ciò mantiene la continuità con la keywording di un argomento nella letteratura più antica, in modo da poter stabilire un riferimento a titoli più antichi. Solo quando la letteratura su un argomento ha raggiunto una certa misura viene introdotto un nuovo termine tecnico. Se l'utilizzo della lingua cambia, è possibile modificare il termine preferito.
Le quantità possono essere trovate nelle relazioni annuali della DNB e nei dati estratti dalla GND [8] .
Il Common Authority File contiene circa 8,9 milioni di record (al 13 giugno 2021) dei seguenti tipi di entità :
tipo/data di entità | fonte | persone (individualizzate) |
Nomi personali (non personalizzati) |
Persone e nomi di persona (totale) |
corporazioni | convegni ed eventi |
geografia | termini tecnici | fabbriche | totale |
---|---|---|---|---|---|---|---|---|---|---|
codice entità | -- | p | n | -- | K | v | G | S | w | -- |
Giugno 2013 | ? | 2.882.000 | 4.628.000 | (7.510.000) | 1.172.000 | 587.000 | 293.000 | 202.000 | 193.000 | (9.957.000) |
2015 | Relazione annuale [9] | nessuna informazione | nessuna informazione | 8.669.790 | 1.240.852 | 619.610 | 289.449 | 205.586 | 244.480 | 11.269.767 |
2016 | Relazione annuale [10] | nessuna informazione | nessuna informazione | 10.546.959 | 1.498.606 | 769.067 | 295.027 | 207.149 | 287.204 | 13.604.012 |
2017 | Relazione annuale [11] | nessuna informazione | nessuna informazione | 11.551.274 | 1.493.823 | 786.180 | 300.138 | 209.003 | 331.310 | 14.671.728 |
2018 | Relazione annuale [12] | nessuna informazione | nessuna informazione | 12.032.087 | 1.487.938 | 803.612 | 305.543 | 211.339 | 367.574 | 15.208.093 |
2019 | Relazione annuale [13] | nessuna informazione | nessuna informazione | 12.265.826 | 1.490.830 | 826.579 | 310.860 | 212.775 | 405.899 | 15.512.769 |
Febbraio 2020 | LDS [14] | 5.251.171 | 7.046.133 | 12.297.304 | 1.491.072 | 829.548 | 311.357 | 212.895 | 410.736 | 15.552.912 |
giugno 2020 | SS [15] | 5.350.953 | abbandonato | (5.350.953) | 1.491.358 | 836.410 | 313.058 | 213.257 | 425.718 | 8.630.754 |
13 ottobre 2020 | LDS [16] | 5.421.947 | abbandonato | (5.421.947) | 1.490.757 | 842.725 | 314.492 | 213.528 | 442.181 | 8.725.630 |
2020 | Relazione annuale [17] | 5.467.413 | nessuna informazione | nessuna informazione | 1.493.057 | 846.449 | 315.389 | 213.655 | 451.414 | 8.787.377 |
13 febbraio 2021 | LDS [18] | 5.496.766 | abbandonato | (5.496.766) | 1.495.527 | 848.846 | 315.924 | 213.779 | 456.893 | 8.827.735 |
13 giugno 2021 | LDS [19] | 5.574.687 | abbandonato | (5.574.687) | 1.501.942 | 854.637 | 317.093 | 203.371 | 468.720 | 8.920.450 |
23 ottobre 2021 | LDS [20] | 5.650.830 | abbandonato | (5.650.830) | 1.507.546 | 854.539 | 318.392 | 203.801 | 479.558 | 9.014.666 |
Al 13 giugno 2021, ci sono 465.790 record di deviazione pubblicati in formato RDF (JSON-LD) su open.dnb.de/opendata. Ciò significa che alcuni record di dati possono essere referenziati tramite diversi identificatori GND.
Data | numero | annotazione |
---|---|---|
13/04/2021 | 461.335 | |
13/06/2021 | 465.790 | |
13/11/2021 | 472.485 | GND, set di deflessione senza Tu |
Al 13 giugno 2021 alle 13:20 UTC, i file "authorities_lds" contengono 163.131.042 triple in 8.920.450 record. [21]
volta | record | triplicare |
---|---|---|
13/06/2021 13:20 UTC | 8.920.450 | 163.131.042 |
13-10-2021 12:20 UTC | 9.014.666 | 165.639.860 |
Il fascicolo dell'autorità comune è conservato presso la Biblioteca nazionale tedesca. Le reti di biblioteche hanno importato una volta lo stock di base GND nei loro sistemi di rete e da allora hanno ottenuto gli aggiornamenti dell'authority file tramite il processo OAI . Il GND non è curato e ampliato solo da biblioteche, ma anche da archivi (finora principalmente archivi scientifici e letterari), musei ed editori di opere di consultazione. La collaborazione avviene tramite associazioni di biblioteche o previa consultazione con la Biblioteca nazionale tedesca. L'utilizzo da parte degli archivi statali e comunali è solo all'inizio (a partire dal 2015).
I dati dell'autorità GND sono disponibili gratuitamente sul sito web di DNB nei formati MARC 21 Authority, MARC21-xml e RDFxml con licenza CC0 1.0 .
Nel dicembre 2012 è stato avviato un progetto di cooperazione tra la Biblioteca nazionale tedesca (DNB) e il German Film Institute (DIF) con il nome di Integrazione interistituzionale dei dati normativi (IN2N). L'obiettivo del progetto, finanziato dalla Fondazione tedesca per la ricerca (DFG), è supportare le istituzioni non bibliotecarie nell'utilizzo del GND e coinvolgerle nell'indicizzazione. [22] Tra l'altro, nell'ambito del progetto, i set di dati di filmportal.de sono stati confrontati con gli articoli personali di Wikipedia . [23]
Alla fine del 2014 i dati standard del DIF sono stati importati nel GND. Nei mesi precedenti, i dati dell'Istituto Iberoamericano (Berlino) e del Centro di ricerca per l'Europa orientale dell'Università di Brema, tra gli altri, erano già stati trasferiti al GND. Dal 6 maggio 2016 i wikipediani che hanno preso parte a un'adeguata formazione hanno potuto creare dati di autorità per le persone utilizzando il "modulo web GND". L'identificatore della libreria corrispondente è Wikimedia Germany (DE-B1592).