Dosarul de autoritate comună | |
---|---|
| |
fondator | 2012 |
Durată | 8.920.450 |
Locație | Frankfurt pe Main |
ISIL | EN-588 |
operator | Biblioteca Națională Germană și altele |
site-ul | https://gnd.network |
Dosarul de autoritate comună ( GND ) este un fișier de autoritate pentru persoane , corporații , congrese , materiale geografice , titluri de subiecte și titluri de lucrări , care este folosit în principal pentru catalogarea literaturii în biblioteci, dar este tot mai utilizat de arhive, muzee, proiecte și în aplicatii web . Este gestionat de Biblioteca Națională Germană (DNB), toate asociațiile de biblioteci în limba germană , baza de date a revistelor(ZDB) și numeroase alte instituții. Datele de autoritate facilitează catalogarea, oferă puncte de acces clare de căutare și posibilitatea de a lega diferite resurse de informații.
La 19 aprilie 2012, GND a înlocuit fișierele de autorități separate anterior Fișierul cu nume personal (PND), Fișierul comun al organismului corporativ (GKD), Fișierul cu autoritatea cuvintelor cheie (SWD) și fișierul cu titlul subiectului uniform al Arhivei muzicale germane (DMA-EST). fişier). Din iulie 2014, datele de autoritate au fost înregistrate conform regulilor RDA , care sunt folosite și de Biblioteca Congresului , printre altele . [1]
Fișierul comun de autoritate a fost dezvoltat între 2009 și 2012 într-un proiect comun al Bibliotecii Naționale Germane, al rețelelor de biblioteci în limba germană și al bazei de date a revistelor. Scopul proiectului a fost de a fuziona fișierele de autoritate GKD, PND și SWD administrate anterior separat și fișierul DMA-EST. Ar trebui implementat un format comun de date, iar diferențele existente în reglementări ar trebui armonizate.
Crearea înregistrărilor de autoritate se baza pe diferite seturi de reguli. Acestea au fost „ Regulile pentru catalogarea alfabetică ” (RAK-WB și RAK-Musik) pentru indexarea formală și „ Regulile pentru catalogarea cuvintelor cheie ” (RSWK) pentru indexarea conținutului .. Regulile inconsecvente pentru crearea denumirii preferate pentru indexarea formală și de conținut au condus la seturi de date redundante în GKD și SWD, în special în domeniul organismelor corporative, congreselor și materialelor geografice. Prin urmare, au fost elaborate reguli tranzitorii pentru GND pentru cazurile în care regulile de indexare formală și de conținut se abate unele de altele, ceea ce permite utilizarea în comun a înregistrărilor de date ale autorității. Regulile tranzitorii țin deja seama, în măsura posibilului , de reglementările ADR ( Descrierea resurselor și accesul ) .
Formatele de date ale fișierelor de autoritate, atât formatele interne, cât și formatele de schimb, au diferit, de asemenea, considerabil în unele cazuri. Formatul de schimb GND se bazează pe MARC 21 Authority. Prin fuzionarea tuturor înregistrărilor de date de autoritate din GND, diferențele de format existente anterior ar putea fi depășite. Cu toate acestea, seturile de date paralele existente din diferitele fișiere de autoritate pot fi îmbinate numai în timp.
În proiectul Virtual International Authority File (VIAF), GND este practic combinat cu alte fișiere de autoritate pentru a forma un fișier internațional de autoritate.
Datele constau din entități și declarații despre acestea. Fiecare entitate are un tip de entitate și cel puțin un identificator.
Fiecare înregistrare descrie o entitate.
Tipurile de entități enumerate aici corespund așa-numitelor tipuri de înregistrare ( tip de înregistrare de date ) din biblioteci .
În dosarul comun de autorizare, un număr unic de identificare (IDN sau PPN; baza pentru identificatorul uniform de resurse în sistemul de producție), un termen preferat standardizat (în trecut și: formă autorizată ), diferite forme de nume (sinonime) și diverse atribute descriptive sunt înregistrate pentru fiecare descriere a entității . Dacă este posibil, atributele sunt stocate ca relații cu alte înregistrări de date de autoritate, tipul de relație fiind codificat în fiecare caz. [2]Exemple de atribute înrudite sunt locurile de naștere și deces ale oamenilor și ocupațiile acestora. Pentru corporații, de ex. Sunt specificate relațiile de predecesor și succesor, dar și supraordonați administrativi. În cazul termenilor subiecti, termenii generici și termenii înrudiți sunt legați. Aceasta înseamnă că literatura despre subiecte conexe poate fi găsită și atunci când căutați într-un catalog de bibliotecă. O prelucrare semantică și tematică bogată și precisă (în funcție de subiect și: orientată dogmatic ) a intrărilor GND una față de cealaltă avantajează calitatea regăsirii .
În acest fel, se creează o rețea semantică de seturi de date înrudite ( linked data ), care este deosebit de potrivită pentru utilizarea pe web, permite navigarea în cadrul fișierului de autoritate și îmbunătățește astfel opțiunile de căutare pentru utilizatori.
La sfârșitul lunii august 2019, utilizarea propozițiilor Tn pentru nume de persoane a fost întreruptă. [3] Un an mai târziu, începând cu 19 iunie 2020, legăturile dintre înregistrările Tn din datele bibliografice au fost șterse retrospectiv. Motivul pentru aceasta a fost calitatea predominant slabă a propozițiilor Tn. Mulți erau doar la un nivel foarte scăzut de catalogare. Adesea a fost neclar căreia îi poate fi atribuit un set de date, astfel încât datele nu au fost clarificate. Au existat duplicate și legături incorecte către datele bibliografice. În loc de link-uri, acum există doar șiruri de text în datele bibliografice. Din iulie 2020, înregistrările de nume nu mai fac parte din dosarul de autoritate comun. [4]
În afară de numele personale, fiecare tip de înregistrare poate fi diferențiat suplimentar prin specificarea unui cod de entitate [5] . De exemplu, o entitate geografică poate fi un stat sau o clădire. Sunt disponibile un total de șase tipuri de entități, care sunt împărțite în aproximativ 50 de subtipuri.
cod | definiție [6] |
---|---|
G | geografie |
da | Clădiri și ansambluri de clădiri, sculpturi monumentale, monumente, morminte etc. conform RSWK §730.1 |
gif; gik | Statele membre (sunt întotdeauna codificate dublu cu „gik”) |
gik | autorităţile locale şi unităţile administrative |
gil; gik | Țări, state (independente) (sunt întotdeauna codificate dublu cu „gik”) |
gin | Unități geografice naturale, unități biogeografice și paleografice, denumiri ale subunităților geografice cu puncte cardinale sau cu alte expresii conform RSWK § 205, 1 și 2 |
gio | Geografie la scară mică într-o locație, cu excepția clădirilor și ansamblurilor de clădiri |
gir; gik | Principate imperiale spirituale (până în 1803), unități administrative ale Bisericii de Răsărit (sunt întotdeauna dublu codificat cu „gik”) |
da; gik | Unități administrative care, conform EH-G-03, primesc un termen generic instantaneu din termenul generic al unității administrative (sunt întotdeauna dublu codificat cu „gik”) |
giw | Granițe, poteci, linii |
gix | estraterrestrica |
giz | Toate denumirile geografice care nu pot fi atribuite niciunuia dintre celelalte subtipuri de entități, regiuni și zone conform RSWK § 204a, inclusiv împrejurimile orașelor și municipalităților individuale |
gxz | Locuri fictive |
k | corporații |
kif | Companii (din ianuarie 2016) |
Kim | Corpuri muzicale (din ianuarie 2016) |
kio | organele autorităților locale |
kip | Proiecte și planuri și programe asemănătoare proiectelor |
kiv; kir | Unități administrative religioase (de exemplu, eparhiile Bisericii Catolice; excepție: unitățile administrative ale Bisericii de Est, unitățile administrative ale Bisericii de Est sunt codificate cu „gir” și „gik”) (sunt întotdeauna codificate dublu cu „kir”) (din ianuarie 2016) ) |
kiz | Toate celelalte organisme corporative care nu aparțin niciunui alt tip de entitate specială |
kxz | Entități fictive |
p | persoane |
pif | Familiile |
pik | Prinți domnitori, membri ai caselor domnești conducătoare |
pip | pseudonime |
pipi | pseudonime colective |
piz | Nume personale care nu aparțin niciunui alt tip de entitate specială |
pxg | zeilor |
pxl | Figuri literare, figuri legendare |
pxs | fantome |
s | termeni tehnici |
sab; soz | Instrumente muzicale (conform RDA 6.15) (sunt întotdeauna dublu codificat cu „saz”) (din ianuarie 2016) |
trist; soz | Purtători de date (conform RDA 3.4.1.3 DA-CH) (sunt întotdeauna dublu codificat cu „saz”) |
sigur; soz | Informații din formular cu privire la tipul de conținut (conform RDA 7.2.1.3 DA-CH) (sunt întotdeauna dublu codificat cu „saz”) |
Spune; soz | Gen muzical (conform RDA 6.14.2.5.2 DA-CH) (sunt întotdeauna dublu codificat cu „saz”) (din ianuarie 2016) |
sam; soz | Forma de ieșire muzicală (conform RDA 7.20.1.3 DA-CH) (sunt întotdeauna codificate dublu cu „saz”) |
soz | termeni generali, i. H. toate titlurile de subiecte care nu aparțin niciunui alt tip de entitate specială |
tu | etnografică |
sif | Mijloace de transport cu nume individuale |
vedea | Evenimente individuale istorice |
înghiţitură | Produse și nume de marcă, altele decât produse software („siw”) |
sora | Limbi |
Hei | Grupuri de persoane care nu sunt persoane juridice |
sw | produse software |
mărimea | Toate faptele individuale care sunt înregistrate ca termeni subiect și nu pot fi atribuite niciunuia dintre celelalte subtipuri de entități, de ex. B. Concursuri |
slz | Literele, morfemele, cuvintele ca obiecte de investigare lingvistică |
snz | Nomenclatură Biologie – Chimie |
sxz | Termeni fictivi |
szz | Toate cazurile de îndoială pentru toate entitățile |
și | |
uiz | Non-corporații (numai în datele moștenite) |
v | conferințe și evenimente |
vie | conferințe, evenimente |
vif | Secvențe sau serii de conferințe, secvențe de evenimente sau seria w |
w | fabrici |
din nou | semnele de imprimantă |
Cum | expresie |
nevasta | Versiunea unei lucrări muzicale (întreruptă din iulie 2014) |
wim | lucrări de muzică |
victorie | colecții |
șterge | caracteristici de proveniență |
stiu | monumente scrise |
spirit | fabrici |
Fiecare entitate poate fi identificată clar prin cel puțin un identificator (GND-ID). Fiecare identificator este format din caracterele de la 0 la 9, X și o cratimă. Un identificator pentru o entitate de tip de entitate p este format din 9 sau 10 caractere, începe întotdeauna cu un 1 urmat de 8 sau 9 cifre și se termină cu un caracter de verificare 0-9 sau X.
Fiecare înregistrare este asociată cu un nivel de catalogare între 1 și 6. Cu cât numărul este mai mic, cu atât este mai mare nivelul intrării GND și setul de date este mai bine procesat. Standardul la crearea unei noi înregistrări de date cu caracter personal este inițial nivelul 3 (Tp3).
Desemnarea preferată se bazează întotdeauna pe lucrările enumerate în „ Lista lucrărilor tehnice de referință pentru Dosarul Comun de Autoritate ”. [7] Denumirea preferată a termenilor subiectului în GND urmează utilizarea generală, deoarece este folosită în enciclopedii ( Brockhaus , Meyer , alternativ și Wikipedia) este detectabil; în cazuri excepționale se folosesc termeni din jargonul tehnic. Sinonimele pot fi incluse în intrări ca variante sau așa-numitele cvasi-sinonime. Atâta timp cât nu există suficiente titluri pentru un subiect, se încearcă mai întâi să se exprime noi fapte prin combinarea mai multor termeni de subiect deja disponibili într-o secvență de cuvinte cheie pentru a evita, pe cât posibil, noi intrări (așa-numitul control al descompunerii). Se menține astfel continuitatea cu cuvintele cheie a unui subiect din literatura mai veche, astfel încât să se poată stabili o referință la titluri mai vechi. Numai atunci când literatura de specialitate a atins o anumită măsură se introduce un nou termen tehnic. Dacă utilizarea limbii se modifică, termenul preferat poate fi ajustat.
Cantitățile pot fi găsite în rapoartele anuale ale DNB și extrasele de date ale GND [8] .
Fișierul de autoritate comună conține aproximativ 8,9 milioane de înregistrări (începând cu 13 iunie 2021) ale următoarelor tipuri de entități :
tip de entitate/data | sursă | persoane (individualizate) |
Nume personale (nu individualizate) |
Persoane și nume de persoane (total) |
corporații | conferințe și evenimente |
geografie | termeni tehnici | fabrici | total |
---|---|---|---|---|---|---|---|---|---|---|
cod de entitate | -- | p | n | -- | k | v | G | s | w | -- |
Iunie 2013 | ? | 2.882.000 | 4.628.000 | (7.510.000) | 1.172.000 | 587.000 | 293.000 | 202.000 | 193.000 | (9.957.000) |
2015 | Raport anual [9] | fara informatii | fara informatii | 8.669.790 | 1.240.852 | 619.610 | 289.449 | 205.586 | 244.480 | 11.269.767 |
2016 | Raport anual [10] | fara informatii | fara informatii | 10.546.959 | 1.498.606 | 769.067 | 295.027 | 207.149 | 287.204 | 13.604.012 |
2017 | Raport anual [11] | fara informatii | fara informatii | 11.551.274 | 1.493.823 | 786.180 | 300.138 | 209.003 | 331.310 | 14.671.728 |
2018 | Raport anual [12] | fara informatii | fara informatii | 12.032.087 | 1.487.938 | 803.612 | 305.543 | 211.339 | 367.574 | 15.208.093 |
2019 | Raport anual [13] | fara informatii | fara informatii | 12.265.826 | 1.490.830 | 826.579 | 310.860 | 212.775 | 405.899 | 15.512.769 |
februarie 2020 | LDS [14] | 5.251.171 | 7.046.133 | 12.297.304 | 1.491.072 | 829.548 | 311.357 | 212.895 | 410.736 | 15.552.912 |
iunie 2020 | LDS [15] | 5.350.953 | abandonat | (5.350.953) | 1.491.358 | 836.410 | 313.058 | 213.257 | 425.718 | 8.630.754 |
13 octombrie 2020 | LDS [16] | 5.421.947 | abandonat | (5.421.947) | 1.490.757 | 842.725 | 314.492 | 213.528 | 442.181 | 8.725.630 |
2020 | Raport anual [17] | 5.467.413 | fara informatii | fara informatii | 1.493.057 | 846.449 | 315.389 | 213.655 | 451.414 | 8.787.377 |
13 februarie 2021 | LDS [18] | 5.496.766 | abandonat | (5.496.766) | 1.495.527 | 848.846 | 315.924 | 213.779 | 456.893 | 8.827.735 |
13 iunie 2021 | LDS [19] | 5.574.687 | abandonat | (5.574.687) | 1.501.942 | 854.637 | 317.093 | 203.371 | 468.720 | 8.920.450 |
23 octombrie 2021 | LDS [20] | 5.650.830 | abandonat | (5.650.830) | 1.507.546 | 854.539 | 318.392 | 203.801 | 479.558 | 9.014.666 |
Începând cu 13 iunie 2021, există 465.790 de înregistrări de deviere publicate în format RDF (JSON-LD) pe open.dnb.de/opendata. Aceasta înseamnă că unele înregistrări de date pot fi referite prin mai mulți identificatori GND.
Data | număr | adnotare |
---|---|---|
13.04.2021 | 461.335 | |
13.06.2021 | 465.790 | |
13.11.2021 | 472.485 | GND, seturi de deviație fără Tu |
Începând cu 13 iunie 2021, 13:20 UTC, fișierele „authorities_lds” conțin 163.131.042 triple în 8.920.450 de înregistrări. [21]
timp | înregistrări | triplu |
---|---|---|
13.06.2021 13:20 UTC | 8.920.450 | 163.131.042 |
2021-10-13 12:20 UTC | 9.014.666 | 165.639.860 |
Dosarul de autoritate comună se păstrează la Biblioteca Națională Germană. Rețelele de biblioteci au importat stocul de bază GND în sistemele lor de rețea o dată și de atunci au obținut actualizări ale fișierului de autorizare prin procesul OAI . GND nu este editat și extins doar de biblioteci, ci și de arhive (până acum în primul rând de arhive științifice și literare), muzee și editori de lucrări de referință. Colaborarea are loc fie prin intermediul asociațiilor de biblioteci, fie după consultarea Bibliotecii Naționale Germane. Utilizarea de către arhivele de stat și municipale este abia la început (din 2015).
Datele autorității GND sunt disponibile gratuit pe site-ul DNB în formatele MARC 21 Authority, MARC21-xml și RDFxml sub licența CC0 1.0 .
În decembrie 2012, a început un proiect de cooperare între Biblioteca Națională Germană (DNB) și Institutul German de Film (DIF) sub numele de Integrare interinstituțională a datelor normative (IN2N). Scopul proiectului, finanțat de Fundația Germană de Cercetare (DFG), este de a sprijini instituțiile non-bibliotecare în utilizarea GND și de a le implica în indexare. [22] Printre altele, în cadrul proiectului, seturile de date de pe filmportal.de au fost comparate cu articolele personale de pe Wikipedia . [23]
La sfârșitul anului 2014, datele standard din DIF au fost importate în GND. În lunile precedente, datele de la Institutul Ibero-American (Berlin) și Centrul de Cercetare pentru Europa de Est de la Universitatea din Bremen, printre altele, fuseseră deja transferate către GND. Din 6 mai 2016, Wikipediaienii care au participat la formarea adecvată au putut să creeze date de autoritate pentru persoane folosind „formularul web GND”. Identificatorul corespunzător al bibliotecii este Wikimedia Germania (DE-B1592).