Felles autoritetsfil | |
---|---|
| |
grunnleggelse | 2012 |
Varighet | 8.920.450 |
plassering | Frankfurt am Main |
ISIL | EN-588 |
operatør | Tysk nasjonalbibliotek og andre |
nettstedet | https://gnd.nettverk |
Common Authority File ( GND ) er en autoritetsfil for personer , selskaper , kongresser , geografisk materiale , emneoverskrifter og arbeidstitler , som først og fremst brukes til å katalogisere litteratur i biblioteker, men også i økende grad brukes av arkiver, museer, prosjekter og i webapplikasjoner . Det administreres av det tyske nasjonalbiblioteket (DNB), alle tyskspråklige bibliotekforeninger , journaldatabasen(ZDB) og en rekke andre institusjoner. Myndighetsdata letter katalogisering, gir oversiktlige søketilgangspunkter og mulighet for å koble sammen ulike informasjonsressurser.
Den 19. april 2012 erstattet GND de tidligere separate autoritetsfilene Personal Name File (PND), Common Corporate Body File (GKD), Keyword Authority File (SWD) og det tyske musikkarkivets enhetlige emnetittelfil (DMA-EST) fil). Siden juli 2014 har myndighetsdata blitt registrert i henhold til RDA - reglene, som også brukes av blant annet Library of Congress . [1]
Fellesmyndighetsfilen ble utviklet fra 2009 til 2012 i et fellesprosjekt av det tyske nasjonalbiblioteket, de tyskspråklige biblioteknettverkene og journaldatabasen. Målet med prosjektet var å slå sammen de tidligere separat administrerte GKD-, PND- og SWD-autoritetsfilene og DMA-EST-filen. Et felles dataformat bør implementeres og de eksisterende forskjellene i regelverket bør harmoniseres.
Opprettelsen av myndighetsposter pleide å være basert på forskjellige sett med regler. Dette var " Regler for alfabetisk katalogisering " (RAK-WB og RAK-Musik) for formell indeksering og " Regler for søkeordkatalogisering " (RSWK) for indeksering av innholdet. De inkonsekvente reglene for å lage den foretrukne betegnelsen for den formelle indekseringen og innholdsindekseringen førte til overflødige datasett i GKD og SWD, spesielt innen selskapsorganer, kongresser og geografisk materiale. Derfor ble det utviklet overgangsregler for GND for tilfeller der reglene for formell indeksering og innholdsindeksering avviker fra hverandre, som muliggjør felles bruk av myndighetsdatapostene. Overgangsreglene tar allerede så langt det er mulig hensyn til forskriftene til RDA ( Resource Description and Access ) .
Myndighetsfilenes dataformater, både de interne formatene og utvekslingsformatene, skilte seg også betydelig i enkelte tilfeller. GND-utvekslingsformatet er basert på MARC 21 Authority. Ved å slå sammen alle myndighetsdataposter i GND, kan de tidligere eksisterende formatforskjellene overvinnes. Eksisterende parallelle datasett fra de forskjellige autorisasjonsfilene kan imidlertid bare slås sammen over tid.
I prosjektet Virtual International Authority File (VIAF) er GND praktisk talt kombinert med andre autoritetsfiler for å danne en internasjonal autoritetsfil.
Dataene består av enheter og utsagn om dem. Hver enhet har en enhetstype og minst én identifikator.
Hver post beskriver en enhet.
Enhetstypene som er listet opp her, tilsvarer såkalte posttyper ( dataposttype ) i biblioteker .
I fellesmyndighetsmappen et unikt identifikasjonsnummer (IDN eller PPN; grunnlag for Uniform Resource Identifier i produksjonssystemet), en standardisert foretrukket term (tidligere også: autorisert form ), ulike former for navn (synonymer) og ulike beskrivende attributter registreres for hver enhetsbeskrivelse . Hvis mulig, lagres attributtene som relasjoner til andre autoritetsdataposter, med relasjonstypen kodet i hvert tilfelle. [2]Eksempler på relaterte attributter er fødesteder og dødssteder for mennesker og deres yrker. For selskaper, f.eks. Forgjenger- og etterfølgerforhold, men også administrative overordnede er spesifisert. Når det gjelder fagtermer, er generiske termer og relaterte termer knyttet sammen. Dette betyr at litteratur om relaterte emner også kan finnes ved søk i en bibliotekskatalog. En rik og nøyaktig semantisk og tematisk (avhengig av emnet også: dogmatisk orientert) behandling av GND-oppføringene til hverandre gagner kvaliteten på gjenfinningen .
På denne måten skapes et semantisk nettverk av relaterte datasett ( linked data ), som er spesielt egnet for bruk på nettet, muliggjør navigering innenfor autorisasjonsfilen og dermed forbedrer søkemulighetene for brukerne.
I slutten av august 2019 ble bruken av Tn-setninger for personnavn avviklet. [3] Ett år senere, fra og med 19. juni 2020, ble koblingene mellom Tn-postene i de bibliografiske dataene slettet i ettertid. Årsaken til dette var den overveiende dårlige kvaliteten på Tn-setningene. Mange var bare på et svært lavt nivå av katalogisering. Det var ofte uklart hvilken person et datasett kunne tilskrives, så dataene ble ikke disambiguerte. Det var duplikater og feil lenker til bibliografiske data. I stedet for lenker er det nå bare tekststrenger i de bibliografiske dataene. Siden juli 2020 er ikke navnepostene lenger en del av den felles myndighetsmappen. [4]
Bortsett fra personnavn, kan hver posttype differensieres ytterligere ved å spesifisere en enhetskode [5] . En geografisk enhet kan for eksempel være en stat eller en bygning. Totalt seks enhetstyper er tilgjengelige, som er delt inn i rundt 50 undertyper.
kode | definisjon [6] |
---|---|
G | geografi |
gi | Bygninger og bygningsensembler, monumentale skulpturer, monumenter, graver osv. i henhold til RSWK §730.1 |
gif; gikk | Medlemsland (de er alltid dobbeltkodet med "gik") |
gikk | lokale myndigheter og administrative enheter |
gil; gikk | Land, stater (uavhengige) (de er alltid dobbeltkodet med "gik") |
gin | Naturgeografiske enheter, biogeografiske og paleografiske enheter, navn på geografiske underenheter med kardinalpunkter eller med andre uttrykk etter RSWK § 205, 1 og 2 |
gio | Småskala geografi innenfor et sted, med unntak av bygninger og bygningsensembler |
gir; gikk | Åndelige keiserlige fyrstedømmer (til 1803), administrative enheter i østkirken (de er alltid dobbeltkodet med "gik") |
gi; gikk | Administrative enheter som i henhold til EH-G-03 mottar en øyeblikkelig generisk term fra generisk term for den administrative enheten (de er alltid dobbeltkodet med "gik") |
giw | Grenser, stier, linjer |
gix | estraterrestrica |
giz | Alle geografiske navn som ikke kan tildeles noen av de andre undertypene, regionene og områdene i henhold til RSWK § 204a, inkludert omgivelsene til enkelte byer og kommuner |
gxz | Fiktive steder |
k | selskaper |
kif | Bedrifter (fra januar 2016) |
kim | Musikalske kropper (fra januar 2016) |
kio | lokale myndigheters organer |
kip | Prosjekter og prosjektlignende planer og programmer |
kiv; kir | Religiøse administrative enheter (f.eks. bispedømmer i den katolske kirke; unntak: østlige kirkelige administrative enheter, østlige kirkelige administrative enheter er kodet med "gir" og "gik") (de er alltid dobbeltkodet med "kir") (fra januar 2016 ) |
kiz | Alle andre selskapsorganer som ikke tilhører noen annen spesiell enhetstype |
kxz | Fiktive enheter |
s | personer |
pif | Familier |
pik | Regjerende prinser, medlemmer av regjerende fyrstehus |
pip | pseudonymer |
tisse | kollektive pseudonymer |
piz | Personnavn som ikke tilhører noen annen spesiell enhetstype |
pxg | guder |
pxl | Litterære skikkelser, legendariske skikkelser |
pxs | spøkelser |
s | tekniskebetingelser |
sab; soz | Musikkinstrumentering (i henhold til RDA 6.15) (de er alltid dobbeltkodet med "saz") (fra januar 2016) |
lei seg; soz | Databærere (i henhold til RDA 3.4.1.3 DA-CH) (de er alltid dobbeltkodet med "saz") |
sikker; soz | Skjemainformasjon om innholdstypen (i henhold til RDA 7.2.1.3 DA-CH) (de er alltid dobbeltkodet med "saz") |
si; soz | Musikalsjanger (i henhold til RDA 6.14.2.5.2 DA-CH) (de er alltid dobbeltkodet med "saz") (fra januar 2016) |
sam; soz | Musikalsk utgangsform (i henhold til RDA 7.20.1.3 DA-CH) (de er alltid dobbeltkodet med "saz") |
soz | generelle vilkår, dvs. H. alle emneoverskrifter som ikke tilhører noen annen spesiell enhetstype |
du | etnografisk |
sif | Transportmiddel med individuelle navn |
se | Historiske enkelthendelser |
nippe | Andre produkter og merkenavn enn programvareprodukter («siw») |
sis | Språk |
Hei | Grupper av mennesker som ikke er bedriftsorganer |
sw | programvareprodukter |
størrelse | Alle individuelle fakta som er registrert som emnebegreper og ikke kan tilordnes noen av de andre enhetsundertypene, f.eks. B. Konkurranser |
slz | Bokstaver, morfemer, ord som gjenstander for språklig undersøkelse |
snz | Nomenklatur Biologi – Kjemi |
sxz | Fiktive termer |
szz | Alle tvilstilfeller for alle enheter |
og | |
uiz | Ikke-selskaper (bare i eldre data) |
v | konferanser og arrangementer |
vie | konferanser, arrangementer |
vif | Konferansesekvenser eller serier, hendelsessekvenser eller serier m |
w | fabrikker |
en gang til | skrivermerker |
hvordan | uttrykk |
wif | Versjon av et musikkverk (avviklet fra juli 2014) |
wim | musikkverk |
vinne | samlinger |
viske | herkomstegenskaper |
vet | skrevne monumenter |
vidd | fabrikker |
Hver enhet kan tydelig identifiseres med minst én identifikator (GND-ID). Hver identifikator består av tegnene 0 til 9, X og en bindestrek. En identifikator for en enhet av enhetstype p består av 9 eller 10 tegn, den starter alltid med en 1 etterfulgt av 8 eller 9 sifre og slutter med et haketegn 0-9 eller X.
Hver post er knyttet til et katalogiseringsnivå mellom 1 og 6. Jo lavere tall, jo høyere nivå på GND-oppføringen og jo bedre behandlet er datasettet. Standarden ved opprettelse av ny personopplysningspost er i utgangspunktet nivå 3 (Tp3).
Den foretrukne betegnelsen er alltid basert på verkene som er oppført i " Liste over tekniske referanseverk for Common Authority File ". [7] Den foretrukne navngivningen av emneord i GND følger generell bruk slik den brukes i leksikon ( Brockhaus , Meyer , alternativt også Wikipedia) er påviselig; unntaksvis benyttes termer fra fagsjargong. Synonymer kan inkluderes i oppføringene som varianter eller såkalte kvasi-synonymer. Så lenge det ikke er nok titler til et emne, forsøkes det først å uttrykke nye fakta ved å kombinere flere allerede tilgjengelige emneord i en nøkkelordrekkefølge for å unngå nye oppføringer så langt som mulig (såkalt dekomponeringskontroll). Dette opprettholder kontinuiteten med nøkkelording av et emne i eldre litteratur, slik at en referanse til eldre titler kan etableres. Først når litteraturen om et tema har nådd et visst omfang, introduseres et nytt fagbegrep. Hvis språkbruken endres, kan den foretrukne termen justeres.
Mengder finnes i årsrapportene til DNB og datautdragene til GND [8] .
Common Authority File inneholder rundt 8,9 millioner poster (per 13. juni 2021) av følgende enhetstyper :
enhetstype/dato | kilde | mennesker (individualisert) |
Personlige navn (ikke individualisert) |
Personer og personnavn (totalt) |
selskaper | konferanser og arrangementer |
geografi | tekniskebetingelser | fabrikker | Total |
---|---|---|---|---|---|---|---|---|---|---|
enhetskode | -- | s | n | -- | k | v | G | s | w | -- |
juni 2013 | ? | 2 882 000 | 4 628 000 | (7 510 000) | 1 172 000 | 587 000 | 293 000 | 202 000 | 193 000 | (9 957 000) |
2015 | Årsrapport [9] | ingen informasjon | ingen informasjon | 8.669.790 | 1 240 852 | 619 610 | 289.449 | 205.586 | 244.480 | 11.269.767 |
2016 | Årsrapport [10] | ingen informasjon | ingen informasjon | 10 546 959 | 1.498.606 | 769 067 | 295 027 | 207.149 | 287.204 | 13.604.012 |
2017 | Årsrapport [11] | ingen informasjon | ingen informasjon | 11.551.274 | 1.493.823 | 786.180 | 300.138 | 209.003 | 331.310 | 14.671.728 |
2018 | Årsrapport [12] | ingen informasjon | ingen informasjon | 12.032.087 | 1.487.938 | 803.612 | 305.543 | 211.339 | 367.574 | 15.208.093 |
2019 | Årsrapport [13] | ingen informasjon | ingen informasjon | 12.265.826 | 1.490.830 | 826.579 | 310.860 | 212.775 | 405.899 | 15.512.769 |
februar 2020 | LDS [14] | 5.251.171 | 7.046.133 | 12.297.304 | 1.491.072 | 829.548 | 311.357 | 212.895 | 410.736 | 15.552.912 |
juni 2020 | LDS [15] | 5.350.953 | droppet ut | (5 350 953) | 1.491.358 | 836.410 | 313.058 | 213.257 | 425.718 | 8.630.754 |
13. oktober 2020 | LDS [16] | 5.421.947 | droppet ut | (5 421 947) | 1.490.757 | 842.725 | 314.492 | 213.528 | 442.181 | 8.725.630 |
2020 | Årsrapport [17] | 5.467.413 | ingen informasjon | ingen informasjon | 1.493.057 | 846.449 | 315.389 | 213.655 | 451.414 | 8.787.377 |
13. februar 2021 | LDS [18] | 5.496.766 | droppet ut | (5 496 766) | 1 495 527 | 848.846 | 315.924 | 213.779 | 456.893 | 8.827.735 |
13. juni 2021 | LDS [19] | 5.574.687 | droppet ut | (5 574 687) | 1 501 942 | 854.637 | 317.093 | 203.371 | 468.720 | 8.920.450 |
23. oktober 2021 | LDS [20] | 5.650.830 | droppet ut | (5 650 830) | 1.507.546 | 854.539 | 318.392 | 203.801 | 479.558 | 9 014 666 |
Per 13. juni 2021 er det 465 790 avbøyningsposter publisert i RDF (JSON-LD)-format på open.dnb.de/opendata. Dette betyr at noen dataposter kan refereres via flere GND-identifikatorer.
Dato | Antall | merknad |
---|---|---|
13.04.2021 | 461.335 | |
13.06.2021 | 465.790 | |
13.11.2021 | 472.485 | GND, avbøyningssett uten Tu |
Per 13. juni 2021 kl. 13.20 UTC inneholder «authorities_lds»-filene 163.131.042 trippel i 8.920.450 poster. [21]
tid | poster | trippel |
---|---|---|
13.06.2021 13:20 UTC | 8.920.450 | 163.131.042 |
2021-10-13 12:20 pm UTC | 9 014 666 | 165.639.860 |
Fellesmyndighetsmappen oppbevares på det tyske nasjonalbiblioteket. Biblioteknettverkene importerte GND-grunnlaget inn i nettverkssystemene sine én gang og har siden fått oppdateringene til autorisasjonsfilen via OAI - prosessen. GND er ikke bare redigert og utvidet av biblioteker, men også av arkiver (så langt primært av vitenskapelige og litterære arkiver), museer og redaktører av oppslagsverk. Samarbeid skjer enten gjennom bibliotekforeninger eller etter samråd med det tyske nasjonalbiblioteket. Bruken av statlige og kommunale arkiver er bare så vidt i gang (fra og med 2015).
GND-myndighetsdataene er tilgjengelige gratis på DNBs nettsider i formatene MARC 21 Authority, MARC21-xml og RDFxml under lisens CC0 1.0 .
I desember 2012 ble et samarbeidsprosjekt mellom det tyske nasjonalbiblioteket (DNB) og det tyske filminstituttet (DIF) startet under navnet Cross- Institutional Integration of Norm Data (IN2N). Målet med prosjektet, finansiert av den tyske forskningsstiftelsen (DFG), er å støtte ikke-bibliotekariske institusjoner i å bruke GND og å involvere dem i indeksering. [22] Blant annet som en del av prosjektet ble datasettene fra filmportal.de sammenlignet med de personlige artiklene fra Wikipedia . [23]
På slutten av 2014 ble standarddataene fra DIF importert til GND. I månedene før var data fra blant annet Ibero-American Institute (Berlin) og Research Centre for Eastern Europe ved Universitetet i Bremen allerede overført til GND. Siden 6. mai 2016 har Wikipedianere som har deltatt i passende opplæring vært i stand til å lage autoritetsdata for enkeltpersoner ved å bruke "GND-nettskjemaet". Den tilsvarende biblioteksidentifikatoren er Wikimedia Tyskland (DE-B1592).