Common Authority -tiedosto | |
---|---|
| |
perustamisesta | 2012 |
Kesto | 8 920 450 |
sijainti | Frankfurt am Main |
ISIL | EN-588 |
operaattori | Saksan kansalliskirjasto ja muut |
sivusto | https://gnd.network |
Common Authority File ( GND ) on henkilöiden , yritysten , kongressien , maantieteellisten aineistojen , aihe- ja työnimikkeiden auktoriteettitiedosto , jota käytetään ensisijaisesti kirjastojen kirjallisuuden luetteloimiseen , mutta jota käytetään yhä enemmän myös arkistoissa, museoissa, projekteissa ja web-sovelluksia . Sitä hallinnoi Saksan kansalliskirjasto (DNB), kaikki saksankieliset kirjastoyhdistykset , lehtitietokanta(ZDB) ja monet muut laitokset. Viranomaiset helpottavat luettelointia, tarjoavat selkeät hakuyhteydet ja mahdollisuuden linkittää erilaisia tietoresursseja.
19. huhtikuuta 2012 GND korvasi aiemmin erilliset auktoriteettitiedostot Personal Name File (PND), Common Corporate Body File (GKD), Keyword Authority File (SWD) ja Saksan musiikkiarkiston yhtenäisen otsikkotiedoston (DMA-EST ). tiedosto). Heinäkuusta 2014 lähtien viranomaistiedot on tallennettu RDA - sääntöjen mukaisesti, joita käyttää myös mm. Library of Congress . [1]
Yhteistä auktoriteettitiedostoa kehitettiin vuosina 2009-2012 Saksan kansalliskirjaston, saksankielisten kirjastoverkostojen ja lehtitietokannan yhteishankkeessa. Projektin tavoitteena oli yhdistää aiemmin erikseen hallitut GKD-, PND- ja SWD-valtuutustiedostot sekä DMA-EST-tiedosto. Yhteinen tietomuoto olisi otettava käyttöön ja olemassa olevat säännösten erot olisi yhdenmukaistettava.
Auktoriteettitietueiden luominen perustui aiemmin erilaisiin sääntöihin. Nämä olivat " Aakkosjärjestyksen säännöt " (RAK-WB ja RAK-Musik) muodollista indeksointia varten ja " Avainsanojen luettelointisäännöt" (RSWK) sisällön indeksoimiseksi.. Epäjohdonmukaiset säännöt suositellun nimityksen luomiseksi muodollisen ja sisällön indeksoinnille johtivat tarpeettomiin tietokokonaisuuksiin GKD:ssä ja SWD:ssä, erityisesti yritysten elinten, kongressien ja maantieteellisten materiaalien alalla. Siksi GND:lle kehitettiin siirtymäsäännöt tapauksiin, joissa muodollisen ja sisällön indeksoinnin säännöt poikkeavat toisistaan, mikä mahdollistaa viranomaistietotietueiden yhteiskäytön. Siirtymäsäännöissä otetaan jo mahdollisuuksien mukaan huomioon RDA:n ( Resource Description and Access ) määräykset.
Myös auktoriteettitiedostojen tietomuodot, sekä sisäiset että vaihtoformaatit, poikkesivat joissain tapauksissa huomattavasti. GND-vaihtomuoto perustuu MARC 21 Authorityyn. Yhdistämällä kaikki auktoriteetin tietueet GND:ssä, aiemmin olemassa olleet muotoerot voitaisiin voittaa. Olemassa olevat rinnakkaiset tietojoukot eri auktoriteettitiedostoista voidaan kuitenkin yhdistää vain ajan myötä.
Virtual International Authority File ( VIAF ) -projektissa GND on käytännössä yhdistetty muihin auktoriteettitiedostoihin kansainväliseksi auktoriteettitiedostoksi.
Tiedot koostuvat kokonaisuuksista ja niitä koskevista lausunnoista. Jokaisella entiteetillä on entiteettityyppi ja vähintään yksi tunniste.
Jokainen tietue kuvaa kokonaisuutta.
Tässä luetellut entiteettityypit vastaavat niin sanottuja tietuetyyppejä ( datatietuetyyppi ) kirjastoissa .
Yhteisessä auktoriteettitiedostossa yksilöllinen tunnistenumero (IDN tai PPN; tuotantojärjestelmän yhtenäisen resurssitunnisteen perusta ), standardoitu etusijalla oleva termi (aiemmin myös: valtuutettu muoto ), eri nimien muotoja (synonyymejä) ja erilaisia kuvailevia attribuutteja. tallennetaan kullekin entiteetin kuvaukselle. Attribuutit tallennetaan mahdollisuuksien mukaan suhteina muihin auktoriteetitietueisiin, jolloin suhteen tyyppi koodataan kussakin tapauksessa. [2]Esimerkkejä asiaan liittyvistä ominaisuuksista ovat ihmisten syntymä- ja kuolinpaikat sekä heidän ammatinsa. Yrityksille, mm. Edeltäjä- ja seuraajasuhteet, mutta myös hallinnolliset esimiehet määritellään. Aihetermien tapauksessa yleistermit ja niihin liittyvät termit on linkitetty. Tämä tarkoittaa, että aiheeseen liittyvää kirjallisuutta löytyy myös kirjaston luettelosta haettaessa. Rikas ja tarkka semanttinen ja temaattinen (aiheesta riippuen myös: dogmaattisesti suuntautunut) GND-merkintöjen toistensa käsittely edistää haun laatua .
Näin syntyy toisiinsa liittyvien tietojoukkojen semanttinen verkko ( linked data ), joka sopii erityisen hyvin verkkokäyttöön, mahdollistaa navigoinnin auktoriteetin tiedostossa ja parantaa siten käyttäjien hakumahdollisuuksia.
Elokuun 2019 lopussa Tn-lauseiden käyttö henkilönimissä lopetettiin. [3] Vuotta myöhemmin, 19.6.2020 alkaen, linkit Tn-tietueiden välillä bibliografisista tiedoista poistettiin takautuvasti. Syynä tähän oli Tn-lauseiden pääosin huono laatu. Monet olivat vain erittäin alhaisella luettelointitasolla. Usein oli epäselvää, kenelle henkilölle tietojoukko voitiin liittää, joten tietoja ei yksiselitteistetty. Siellä oli kaksoiskappaleita ja vääriä linkkejä bibliografisiin tietoihin. Linkkien sijaan bibliografisissa tiedoissa on nyt vain tekstijonoja. Heinäkuusta 2020 lähtien nimitietueet eivät ole enää osa yhteistä auktoriteettitiedostoa. [4]
Henkilönimiä lukuun ottamatta jokainen tietuetyyppi voidaan erottaa tarkemmin määrittämällä entiteettikoodi [5] . Maantieteellinen kokonaisuus voi olla esimerkiksi osavaltio tai rakennus. Saatavilla on yhteensä kuusi entiteettityyppiä, jotka on jaettu noin 50 alatyyppiin.
koodi | määritelmä [6] |
---|---|
G | maantiede |
antaa | Rakennukset ja rakennuskokonaisuudet, monumentaaliset veistokset, monumentit, haudat jne . RSWK §730.1 mukaisesti |
gif; gik | jäsenvaltiot (ne on aina kaksoiskoodattu sanalla "gik") |
gik | paikallisviranomaiset ja hallintoyksiköt |
gil; gik | Maat, osavaltiot (riippumattomat) (ne on aina kaksoiskoodattu "gik":llä) |
gin | Luonnonmaantieteelliset yksiköt, biomaantieteelliset ja paleografiset yksiköt, maantieteellisten alayksiköiden nimet pääpisteillä tai muilla ilmaisuilla RSWK § 205, 1 ja 2 mukaisesti |
gio | Pienimuotoiset maantieteelliset tiedot sijainnin sisällä, lukuun ottamatta rakennuksia ja rakennuskokonaisuuksia |
gir; gik | Hengelliset keisarilliset ruhtinaskunnat (vuoteen 1803), itäisen kirkon hallintoyksiköt (ne on aina kaksoiskoodattu "gik":llä) |
giv; gik | Hallintoyksiköt, jotka EH-G-03:n mukaan saavat välittömän yleistermin hallintoyksikön yleistermistä (ne on aina kaksoiskoodattu "gik":llä) |
giw | Rajat, polut, viivat |
gix | estraterrestrica |
giz | Kaikki maantieteelliset nimet, joita ei voida antaa millekään muulle kokonaisuuden alatyypeille, alueille ja alueille RSWK §:n 204a mukaisesti, mukaan lukien yksittäisten kaupunkien ja kuntien ympäristöt |
gxz | Fiktiiviset paikat |
k | yhtiöt |
kif | Yritykset (tammikuusta 2016 alkaen) |
kim | Musiikkikappaleet (tammikuusta 2016 alkaen) |
kio | paikallisviranomaisten elimet |
kip | Projektit ja projektimaiset suunnitelmat ja ohjelmat |
kiv; kir | Uskonnolliset hallintoyksiköt (esim. katolisen kirkon hiippakunnat; poikkeus: itäkirkon hallintoyksiköt, itäkirkon hallintoyksiköt on koodattu "gir" ja "gik") (ne on aina kaksoiskoodattu "kir") (tammikuusta 2016 alkaen ) |
kiz | Kaikki muut yrityselimet, jotka eivät kuulu mihinkään muuhun erityiseen yhteisötyyppiin |
kxz | Fiktiiviset kokonaisuudet |
p | henkilöt |
pif | Perheet |
pik | Hallitsevat ruhtinaat, hallitsevien ruhtinastalojen jäsenet |
pip | pseudonyymejä |
pissaa | kollektiiviset pseudonyymit |
piz | Henkilönimet, jotka eivät kuulu mihinkään muuhun erityiseen entiteettityyppiin |
pxg | jumalat |
pxl | Kirjallisia hahmoja, legendaarisia hahmoja |
pxs | kummituksia |
s | teknisiä termejä |
sab; soz | Musiikki-instrumentointi ( RDA 6.15:n mukaan) (ne on aina kaksoiskoodattu sanalla "saz") (tammikuusta 2016 alkaen) |
surullinen; soz | Tietovälineet (RDA 3.4.1.3 DA-CH mukaan) (ne on aina kaksoiskoodattu "saz":lla) |
turvallinen; soz | Lomaketiedot sisällön tyypistä (RDA 7.2.1.3 DA-CH mukaan) (ne on aina kaksoiskoodattu sanalla "saz") |
sanoa; soz | Musiikkityyli (RDA 6.14.2.5.2 DA-CH mukaan) (ne on aina kaksoiskoodattu sanalla "saz") (tammikuusta 2016 alkaen) |
sam; soz | Musiikin lähtömuoto (RDA 7.20.1.3 DA-CH mukaan) (ne on aina kaksoiskoodattu "saz":lla) |
soz | yleiset ehdot, ts. H. kaikki aiheen otsikot, jotka eivät kuulu mihinkään muuhun erityiseen entiteettityyppiin |
sinä | etnographica |
sif | Kuljetusvälineet yksittäisillä nimillä |
katso | Historiallisia yksittäisiä tapahtumia |
siemailla | Muut tuotteet ja tuotenimet kuin ohjelmistotuotteet ("siw") |
sis | Kieli (kielet |
Hei | Ihmisryhmät, jotka eivät ole yhtiöitä |
sw | ohjelmistotuotteita |
koko | Kaikki yksittäiset faktat, jotka kirjataan aihetermeiksi ja joita ei voida liittää mihinkään muuhun entiteettialatyyppeihin, esim. B. Kilpailut |
slz | Kirjaimet, morfeemit, sanat kielellisen tutkimuksen kohteina |
snz | Nimikkeistö Biologia – kemia |
sxz | Fiktiiviset termit |
szz | Kaikki epäilyttävät tapaukset kaikille yhteisöille |
ja | |
uiz | Ei-yhtiöt (vain vanhoissa tiedoissa) |
v | konferensseja ja tapahtumia |
vie | konferensseja, tapahtumia |
vif | Konferenssijaksot tai sarjat, tapahtumajaksot tai sarjat w |
w | tehtaita |
uudelleen | tulostimen merkit |
Miten | ilmaisu |
vaimo | Musiikkiteoksen versio (poistettu heinäkuusta 2014) |
wim | musiikin teoksia |
voittaa | kokoelmat |
pyyhkiä | alkuperäominaisuudet |
tietää | kirjallisia monumentteja |
viisaus | tehtaita |
Jokainen entiteetti voidaan selvästi tunnistaa ainakin yhdellä tunnisteella (GND-ID). Jokainen tunniste koostuu merkeistä 0-9, X ja yhdysviivasta. Entiteettityypin p entiteetin tunniste koostuu 9 tai 10 merkistä, se alkaa aina numerolla 1, jota seuraa 8 tai 9 numeroa ja päättyy tarkistusmerkkiin 0-9 tai X.
Jokainen tietue liittyy luettelointitasoon 1–6. Mitä pienempi numero, sitä korkeampi GND-syötön taso ja sitä paremmin käsitelty tietojoukko on. Uutta henkilötietotietuetta luotaessa standardi on aluksi taso 3 (Tp3).
Ensisijainen nimitys perustuu aina " Yhteisviranomaisen tiedostojen teknisten vertailuteosten luettelo" -luettelossa lueteltuihin töihin . [7] Aihetermien suositeltu nimeäminen GND:ssä noudattaa yleistä käyttöä, kuten sitä käytetään tietosanakirjoissa ( Brockhaus , Meyer , vaihtoehtoisesti myös Wikipedia) on havaittavissa; poikkeustapauksissa käytetään termejä teknisestä ammattikielestä. Synonyymit voidaan sisällyttää merkintöihin muunnelmina tai ns. kvasisynonyymeinä. Niin kauan kuin aiheelle ei ole tarpeeksi otsikoita, yritetään ensin ilmaista uusia faktoja yhdistämällä useita jo saatavilla olevia aihetermejä avainsanajonoon uusien merkintöjen välttämiseksi mahdollisimman pitkälle (ns. dekompositioohjaus). Tämä ylläpitää jatkuvuutta aiheen avainsanojen kanssa vanhemmassa kirjallisuudessa, jotta voidaan muodostaa viittaus vanhempiin nimikkeisiin. Vasta kun aihetta koskeva kirjallisuus on saavuttanut tietyn rajan, otetaan käyttöön uusi tekninen termi. Jos kielenkäyttö muuttuu, haluttua termiä voidaan muuttaa.
Määrät löytyvät DNB:n vuosikertomuksista ja GND:n tietootteista [8] .
Common Authority -tiedosto sisältää noin 8,9 miljoonaa tietuetta (13.6.2021) seuraavista entiteettityypeistä :
entiteetin tyyppi / päivämäärä | lähde | ihmiset (yksilöllinen) |
Henkilönimet (ei yksilöity) |
Henkilöt ja henkilönimet (yhteensä) |
yhtiöt | konferensseja ja tapahtumia |
maantiede | teknisiä termejä | tehtaita | kaikki yhteensä |
---|---|---|---|---|---|---|---|---|---|---|
entiteetin koodi | -- | p | n | -- | k | v | G | s | w | -- |
Kesäkuu 2013 | ? | 2 882 000 | 4 628 000 | (7 510 000) | 1 172 000 | 587 000 | 293 000 | 202 000 | 193 000 | (9 957 000) |
2015 | Vuosikertomus [9] | Ei tietoja | Ei tietoja | 8,669,790 | 1 240 852 | 619 610 | 289 449 | 205,586 | 244 480 | 11 269 767 |
2016 | Vuosikertomus [10] | Ei tietoja | Ei tietoja | 10 546 959 | 1 498 606 | 769 067 | 295 027 | 207,149 | 287 204 | 13.604.012 |
2017 | Vuosikertomus [11] | Ei tietoja | Ei tietoja | 11 551 274 | 1 493 823 | 786 180 | 300 138 | 209.003 | 331 310 | 14 671 728 |
2018 | Vuosikertomus [12] | Ei tietoja | Ei tietoja | 12.032.087 | 1 487 938 | 803 612 | 305,543 | 211 339 | 367,574 | 15.208.093 |
2019 | Vuosikertomus [13] | Ei tietoja | Ei tietoja | 12 265 826 | 1 490 830 | 826 579 | 310 860 | 212 775 | 405,899 | 15 512 769 |
Helmikuu 2020 | LDS [14] | 5,251,171 | 7,046,133 | 12 297 304 | 1 491 072 | 829 548 | 311 357 | 212,895 | 410 736 | 15 552 912 |
Kesäkuu 2020 | LDS [15] | 5 350 953 | pudonnut | (5 350 953) | 1 491 358 | 836 410 | 313,058 | 213 257 | 425 718 | 8,630,754 |
13 lokakuuta 2020 | LDS [16] | 5,421,947 | pudonnut | (5 421 947) | 1 490 757 | 842 725 | 314 492 | 213,528 | 442.181 | 8,725,630 |
2020 | Vuosikertomus [17] | 5,467,413 | Ei tietoja | Ei tietoja | 1 493 057 | 846 449 | 315,389 | 213 655 | 451 414 | 8,787,377 |
13. helmikuuta 2021 | LDS [18] | 5,496,766 | pudonnut | (5 496 766) | 1 495 527 | 848 846 | 315,924 | 213,779 | 456,893 | 8,827,735 |
13. kesäkuuta 2021 | LDS [19] | 5,574,687 | pudonnut | (5 574 687) | 1,501,942 | 854 637 | 317,093 | 203,371 | 468 720 | 8 920 450 |
23. lokakuuta 2021 | LDS [20] | 5 650 830 | pudonnut | (5 650 830) | 1,507,546 | 854 539 | 318,392 | 203.801 | 479 558 | 9,014,666 |
13. kesäkuuta 2021 mennessä 465 790 poikkeutustietuetta on julkaistu RDF (JSON-LD) -muodossa osoitteessa open.dnb.de/opendata. Tämä tarkoittaa, että joihinkin tietueisiin voidaan viitata useiden GND-tunnisteiden kautta.
Päivämäärä | määrä | huomautus |
---|---|---|
13.04.2021 | 461 335 | |
13.06.2021 | 465 790 | |
13.11.2021 | 472 485 | GND, poikkeutussarjat ilman Tu |
13. kesäkuuta 2021 klo 13.20 UTC, "authorities_lds"-tiedostot sisältävät 163 131 042 kolminkertaista 8 920 450 tietueessa. [21]
aika | levyjä | kolminkertaistaa |
---|---|---|
13.6.2021 klo 13.20 UTC | 8 920 450 | 163.131.042 |
13.10.2021 klo 12.20 UTC | 9,014,666 | 165 639 860 |
Yhteinen viranomainentiedosto säilytetään Saksan kansalliskirjastossa. Kirjastoverkot toivat GND-peruskannan verkkojärjestelmiinsä kerran ja ovat sittemmin saaneet päivitykset auktoriteettitiedostoon OAI - prosessin kautta. GND:tä eivät toimittaneet ja laajentavat vain kirjastot, vaan myös arkistot (toistaiseksi pääasiassa tieteelliset ja kirjalliset arkistot), museot ja hakuteostoimittajat. Yhteistyötä tapahtuu joko kirjastoyhdistysten kautta tai Saksan kansalliskirjaston kuulemisen jälkeen. Valtion- ja kuntaarkiston käyttö on vasta alkamassa (vuodesta 2015).
GND:n auktoriteetit ovat saatavilla ilmaiseksi DNB:n verkkosivuilla muodoissa MARC 21 Authority, MARC21-xml ja RDFxml lisenssillä CC0 1.0 .
Joulukuussa 2012 käynnistettiin Saksan kansalliskirjaston (DNB) ja Saksan elokuvainstituutin (DIF) yhteistyöprojekti nimellä Cross- Institutional Integration of Norm Data (IN2N). Saksan tutkimussäätiön (DFG) rahoittaman hankkeen tavoitteena on tukea kirjaston ulkopuolisia instituutioita GND:n käytössä ja ottaa ne mukaan indeksointiin. [22] Osana projektia verrattiin muun muassa filmportal.de:n tietosarjoja Wikipedian henkilökohtaisiin artikkeleihin . [23]
Vuoden 2014 lopussa vakiotiedot DIF:stä tuotiin GND:hen. Aikaisempien kuukausien aikana muun muassa Ibero-American Instituten (Berliini) ja Bremenin yliopiston Itä-Euroopan tutkimuskeskuksen tiedot oli jo siirretty GND:lle. Asianmukaiseen koulutukseen osallistuneet wikipedistit ovat 6. toukokuuta 2016 lähtien pystyneet luomaan auktoriteettidataa henkilöille "GND-verkkolomakkeella". Vastaava kirjaston tunniste on Wikimedia Germany (DE-B1592).