Fælles myndighedsfil | |
---|---|
| |
stiftelse | 2012 |
Varighed | 8.920.450 |
Beliggenhed | Frankfurt am Main |
ISIL | EN-588 |
operatør | Tysk Nationalbibliotek m.fl |
websted | https://gnd.network |
Common Authority File ( GND ) er en myndighedsfil for personer , selskaber , kongresser , geografiske materialer , emneoverskrifter og værktitler , som primært bruges til at katalogisere litteratur på biblioteker, men også i stigende grad bruges af arkiver, museer, projekter og i webapplikationer . Det administreres af det tyske nationalbibliotek (DNB), alle tysksprogede biblioteksforeninger , tidsskriftsdatabasen(ZDB) og adskillige andre institutioner. Myndighedsdata letter katalogisering, tilbyder klare søgeadgangspunkter og mulighed for at sammenkæde forskellige informationsressourcer.
Den 19. april 2012 erstattede GND de tidligere separate autoritetsfiler Personal Name File (PND), Common Corporate Body File (GKD), Keyword Authority File (SWD) og det tyske musikarkivs ensartede emnetitelfil (DMA-EST) fil). Siden juli 2014 er myndighedsdataene blevet registreret efter RDA - reglerne, som blandt andet også bruges af Library of Congress . [1]
Den fælles myndighedsfil blev udviklet fra 2009 til 2012 i et fælles projekt af det tyske nationalbibliotek, de tysksprogede biblioteksnetværk og tidsskriftsdatabasen. Målet med projektet var at fusionere de tidligere separat administrerede GKD-, PND- og SWD-autoritetsfiler og DMA-EST-filen. Et fælles dataformat bør implementeres, og de eksisterende forskelle i lovgivningen bør harmoniseres.
Oprettelse af myndighedsregistre plejede at være baseret på forskellige sæt regler. Disse var " Regler for alfabetisk katalogisering " (RAK-WB og RAK-Musik) for formel indeksering og " Regler for søgeordskatalogisering " (RSWK) for indeksering af indholdet. De inkonsekvente regler for at skabe den foretrukne betegnelse for den formelle indeksering og indholdsindeksering førte til overflødige datasæt i GKD og SWD, især inden for virksomhedsorganer, kongresser og geografiske materialer. Derfor blev der udviklet overgangsregler for GND for tilfælde, hvor reglerne for formel og indholdsindeksering afviger fra hinanden, hvilket muliggør fælles brug af myndighedsdataposterne. Overgangsreglerne tager allerede så vidt muligt hensyn til RDA's regler ( Resource Description and Access ) .
Myndighedsfilernes dataformater, både de interne formater og udvekslingsformaterne, afveg også betydeligt i nogle tilfælde. GND-udvekslingsformatet er baseret på MARC 21 Authority. Ved at slå alle myndighedsdataposter sammen i GND kunne de tidligere eksisterende formatforskelle overvindes. Eksisterende parallelle datasæt fra de forskellige myndighedsfiler kan dog kun flettes over tid.
I projektet Virtual International Authority File (VIAF) er GND virtuelt kombineret med andre myndighedsfiler for at danne en international myndighedsfil.
Dataene består af enheder og udsagn om dem. Hver enhed har en enhedstype og mindst én identifikator.
Hver post beskriver en enhed.
De entitetstyper, der er anført her, svarer til såkaldte posttyper ( dataposttype ) i biblioteker .
I den fælles myndighedsfil et unikt identifikationsnummer (IDN eller PPN; grundlag for Uniform Resource Identifier i produktionssystemet), en standardiseret foretrukket term (tidligere også: autoriseret form ), forskellige former for navne (synonymer) og forskellige beskrivende attributter registreres for hver enhedsbeskrivelse . Hvis det er muligt, gemmes attributterne som relationer til andre myndighedsdataposter, hvor typen af relation kodes i hvert enkelt tilfælde. [2]Eksempler på relaterede egenskaber er føde- og dødssteder for mennesker og deres erhverv. For virksomheder, f.eks. Forgænger- og efterfølgerforhold, men også administrative overordnede er specificeret. I tilfælde af emnetermer er generiske termer og relaterede termer forbundet. Det betyder, at der også kan findes litteratur om relaterede emner ved søgning i et bibliotekskatalog. En rig og nøjagtig semantisk og tematisk (afhængigt af emnet også: dogmatisk orienteret) behandling af GND-posterne til hinanden gavner kvaliteten af genfindingen .
På den måde skabes et semantisk netværk af relaterede datasæt ( linked data ), som er særligt velegnet til brug på nettet, tillader navigation indenfor myndighedsfilen og dermed forbedrer søgemulighederne for brugerne.
I slutningen af august 2019 blev brugen af Tn-sætninger til personnavne ophørt. [3] Et år senere, fra den 19. juni 2020, blev links mellem Tn-posterne i de bibliografiske data slettet med tilbagevirkende kraft. Årsagen til dette var den overvejende dårlige kvalitet af Tn-sætningerne. Mange var kun på et meget lavt niveau af katalogisering. Det var ofte uklart, hvilken person et datasæt kunne henføres til, så dataene blev ikke disambiguerede. Der var dubletter og forkerte links til bibliografiske data. I stedet for links er der nu kun tekststrenge i de bibliografiske data. Siden juli 2020 er navneregistrene ikke længere en del af den fælles myndighedsfil. [4]
Bortset fra personnavne kan hver posttype differentieres yderligere ved at angive en enhedskode [5] . For eksempel kan en geografisk enhed være en stat eller en bygning. I alt seks enhedstyper er tilgængelige, som er opdelt i omkring 50 undertyper.
kode | definition [6] |
---|---|
G | geografi |
give | Bygninger og bygningsensembler, monumentale skulpturer, monumenter, grave osv. i henhold til RSWK §730.1 |
gif; gik | Medlemslande (de er altid dobbeltkodet med "gik") |
gik | lokale myndigheder og administrative enheder |
gil; gik | Lande, stater (uafhængige) (de er altid dobbeltkodet med "gik") |
gin | Naturgeografiske enheder, biogeografiske og palæografiske enheder, navne på geografiske underenheder med kardinalpunkter eller med andre udtryk i henhold til RSWK § 205, 1 og 2. |
gio | Geografi i lille skala inden for et sted, med undtagelse af bygninger og bygningsensembler |
gir; gik | Åndelige kejserlige fyrstendømmer (indtil 1803), administrative enheder i den østlige kirke (de er altid dobbeltkodet med "gik") |
giv; gik | Administrative enheder, der ifølge EH-G-03 modtager en øjeblikkelig generisk term fra den administrative enheds generiske term (de er altid dobbeltkodet med "gik") |
giw | Grænser, stier, linjer |
gix | estraterrestrica |
giz | Alle geografiske navne, der ikke kan tildeles nogen af de andre enhedsundertyper, regioner og områder i henhold til RSWK § 204a, inklusive omgivelserne i de enkelte byer og kommuner |
gxz | Fiktive steder |
k | virksomheder |
kif | Virksomheder (fra januar 2016) |
kim | Musikalske kroppe (fra januar 2016) |
kio | lokale myndigheders organer |
kip | Projekter og projektlignende planer og programmer |
kiv; kir | Religiøse administrative enheder (f.eks. den katolske kirkes bispedømmer; undtagelse: østkirkens administrative enheder, østkirkens administrative enheder er kodet med "gir" og "gik") (de er altid dobbeltkodet med "kir") (fra januar 2016 ) |
kiz | Alle andre selskabsorganer, der ikke tilhører nogen anden særlig enhedstype |
kxz | Fiktive enheder |
s | personer |
pif | Familier |
pik | Regerende fyrster, medlemmer af regerende fyrstehuse |
pip | pseudonymer |
tisse | kollektive pseudonymer |
piz | Personnavne, der ikke tilhører nogen anden særlig enhedstype |
pxg | guder |
pxl | Litterære figurer, legendariske figurer |
pxs | spøgelser |
s | tekniske udtryk |
sab; soz | Musikinstrumentering (ifølge RDA 6.15) (de er altid dobbeltkodet med "saz") (fra januar 2016) |
trist; soz | Databærere (ifølge RDA 3.4.1.3 DA-CH) (de er altid dobbeltkodet med "saz") |
sikker; soz | Formularoplysninger om indholdstypen (i henhold til RDA 7.2.1.3 DA-CH) (de er altid dobbeltkodet med "saz") |
sige; soz | Musikgenre (ifølge RDA 6.14.2.5.2 DA-CH) (de er altid dobbeltkodet med "saz") (fra januar 2016) |
sam; soz | Musikalsk outputform (ifølge RDA 7.20.1.3 DA-CH) (de er altid dobbeltkodet med "saz") |
soz | generelle vilkår, dvs. H. alle emneoverskrifter, der ikke tilhører nogen anden særlig enhedstype |
du | etnografiske |
sif | Transportmidler med individuelle navne |
se | Historiske enkeltbegivenheder |
nippe til | Andre produkter og mærkenavne end softwareprodukter ("siw") |
sis | Sprog |
Hej | Grupper af mennesker, der ikke er selskaber |
sw | software produkter |
størrelse | Alle individuelle fakta, der er registreret som emnevilkår og ikke kan henføres til nogen af de andre enhedsundertyper, f.eks. B. Konkurrencer |
slz | Bogstaver, morfemer, ord som objekter for sproglig undersøgelse |
snz | Nomenklatur Biologi – Kemi |
sxz | Fiktive udtryk |
szz | Alle tvivlstilfælde for alle enheder |
og | |
uiz | Ikke-selskaber (kun i ældre data) |
v | konferencer og arrangementer |
vie | konferencer, arrangementer |
vif | Konferencesekvenser eller serier, begivenhedssekvenser eller serier m |
w | fabrikker |
igen | printermærker |
hvordan | udtryk |
wif | Version af et musikværk (udgået fra juli 2014) |
wim | musikværker |
vinde | samlinger |
wip | herkomstegenskaber |
ved godt | skrevne monumenter |
vid | fabrikker |
Hver enhed kan tydeligt identificeres med mindst én identifikator (GND-ID). Hver identifikator består af tegnene 0 til 9, X og en bindestreg. En identifikator for en enhed af enhedstype p består af 9 eller 10 tegn, den starter altid med et 1 efterfulgt af 8 eller 9 cifre og slutter med et afkrydsningstegn 0-9 eller X.
Hver post er knyttet til et katalogiseringsniveau mellem 1 og 6. Jo lavere tallet er, jo højere er niveauet af GND-indtastningen, og jo bedre behandlet er datasættet. Standarden ved oprettelse af en ny persondatapost er i første omgang niveau 3 (Tp3).
Den foretrukne betegnelse er altid baseret på de værker, der er anført i " Liste over tekniske opslagsværker for Common Authority File ". [7] Den foretrukne navngivning af emneudtryk i GND følger almindelig brug, som den bruges i encyklopædier ( Brockhaus , Meyer , alternativt også Wikipedia) er påviselig; undtagelsesvis anvendes termer fra fagsproget. Synonymer kan indgå i posterne som varianter eller såkaldte kvasi-synonymer. Så længe der ikke er nok titler til et emne, forsøger man først at udtrykke nye fakta ved at kombinere flere allerede tilgængelige emneudtryk i en søgeordssekvens for så vidt muligt at undgå nye indtastninger (såkaldt dekomponeringskontrol). Herved bevares kontinuiteten med søgeordet af et emne i den ældre litteratur, således at der kan etableres en reference til ældre titler. Først når litteraturen om et emne har nået et vist omfang, introduceres et nyt fagudtryk. Hvis sprogbrugen ændres, kan det foretrukne udtryk justeres.
Mængder kan findes i DNB's årsrapporter og datauddragene fra GND [8] .
Common Authority File indeholder omkring 8,9 millioner poster (pr. 13. juni 2021) af følgende enhedstyper :
enhedstype/dato | kilde | mennesker (individualiseret) |
Personlige navne (ikke individualiseret) |
Personer og personnavne (i alt) |
virksomheder | konferencer og arrangementer |
geografi | tekniske udtryk | fabrikker | i alt |
---|---|---|---|---|---|---|---|---|---|---|
enhedskode | -- | s | n | -- | k | v | G | s | w | -- |
juni 2013 | ? | 2.882.000 | 4.628.000 | (7.510.000) | 1.172.000 | 587.000 | 293.000 | 202.000 | 193.000 | (9.957.000) |
2015 | Årsrapport [9] | ingen information | ingen information | 8.669.790 | 1.240.852 | 619.610 | 289.449 | 205.586 | 244.480 | 11.269.767 |
2016 | Årsrapport [10] | ingen information | ingen information | 10.546.959 | 1.498.606 | 769.067 | 295.027 | 207.149 | 287.204 | 13.604.012 |
2017 | Årsrapport [11] | ingen information | ingen information | 11.551.274 | 1.493.823 | 786.180 | 300.138 | 209.003 | 331.310 | 14.671.728 |
2018 | Årsrapport [12] | ingen information | ingen information | 12.032.087 | 1.487.938 | 803.612 | 305.543 | 211.339 | 367.574 | 15.208.093 |
2019 | Årsrapport [13] | ingen information | ingen information | 12.265.826 | 1.490.830 | 826.579 | 310.860 | 212.775 | 405.899 | 15.512.769 |
februar 2020 | LDS [14] | 5.251.171 | 7.046.133 | 12.297.304 | 1.491.072 | 829.548 | 311.357 | 212.895 | 410.736 | 15.552.912 |
juni 2020 | LDS [15] | 5.350.953 | droppede ud | (5.350.953) | 1.491.358 | 836.410 | 313.058 | 213.257 | 425.718 | 8.630.754 |
13. oktober 2020 | LDS [16] | 5.421.947 | droppede ud | (5.421.947) | 1.490.757 | 842.725 | 314.492 | 213.528 | 442.181 | 8.725.630 |
2020 | Årsrapport [17] | 5.467.413 | ingen information | ingen information | 1.493.057 | 846.449 | 315.389 | 213.655 | 451.414 | 8.787.377 |
13. februar 2021 | LDS [18] | 5.496.766 | droppede ud | (5.496.766) | 1.495.527 | 848.846 | 315.924 | 213.779 | 456.893 | 8.827.735 |
13. juni 2021 | LDS [19] | 5.574.687 | droppede ud | (5.574.687) | 1.501.942 | 854.637 | 317.093 | 203.371 | 468.720 | 8.920.450 |
23. oktober 2021 | LDS [20] | 5.650.830 | droppede ud | (5.650.830) | 1.507.546 | 854.539 | 318.392 | 203.801 | 479.558 | 9.014.666 |
Pr. 13. juni 2021 er der 465.790 afbøjningsposter offentliggjort i RDF (JSON-LD) format på open.dnb.de/opendata. Det betyder, at nogle dataposter kan refereres via flere GND-identifikatorer.
dato | nummer | anmærkning |
---|---|---|
13/04/2021 | 461.335 | |
13/06/2021 | 465.790 | |
13/11/2021 | 472.485 | GND, afbøjningssæt uden Tu |
Fra den 13. juni 2021 kl. 13.20 UTC indeholder "autorities_lds"-filerne 163.131.042 tripler i 8.920.450 poster. [21]
tid | optegnelser | tredobbelt |
---|---|---|
13/06/2021 13:20 UTC | 8.920.450 | 163.131.042 |
13-10-2021 12:20 UTC | 9.014.666 | 165.639.860 |
Den fælles myndigheds sag opbevares på det tyske nationalbibliotek. Biblioteksnetværkene importerede GND-grundlaget til deres netværkssystemer én gang og har siden fået opdateringerne til myndighedsfilen via OAI - processen. GND er ikke kun redigeret og udvidet af biblioteker, men også af arkiver (indtil videre primært af videnskabelige og litterære arkiver), museer og redaktører af opslagsværker. Samarbejdet foregår enten gennem biblioteksforeninger eller efter samråd med det tyske nationalbibliotek. Brugen af statslige og kommunale arkiver er kun lige begyndt (fra 2015).
GND-myndighedsdataene er gratis tilgængelige på DNB's hjemmeside i formaterne MARC 21 Authority, MARC21-xml og RDFxml under licens CC0 1.0 .
I december 2012 startede et samarbejdsprojekt mellem det tyske nationalbibliotek (DNB) og det tyske filminstitut (DIF) under navnet Cross- Institutional Integration of Norm Data (IN2N). Målet med projektet, finansieret af den tyske forskningsfond (DFG), er at støtte ikke-bibliotekariske institutioner i at bruge GND og at inddrage dem i indeksering. [22] Blandt andet som en del af projektet blev datasættene fra filmportal.de sammenlignet med de personlige artikler fra Wikipedia . [23]
I slutningen af 2014 blev standarddata fra DIF importeret til GND. I månederne forinden var data fra blandt andet Ibero-American Institute (Berlin) og Research Center for Eastern Europe ved universitetet i Bremen allerede blevet overført til GND. Siden den 6. maj 2016 har Wikipedianere, der har deltaget i passende træning, været i stand til at oprette myndighedsdata for enkeltpersoner ved hjælp af "GND-webformularen". Den tilsvarende biblioteksidentifikator er Wikimedia Germany (DE-B1592).