Common Authority File | |
---|---|
| |
založení | 2012 |
Doba trvání | 8,920,450 |
umístění | Frankfurt nad Mohanem |
ISIL | EN-588 |
operátor | Německá národní knihovna a další |
místo | https://gnd.network |
Common Authority File ( GND ) je soubor autorit pro osoby , korporace , kongresy , geografické materiály , předmětová hesla a názvy prací , který se primárně používá ke katalogizaci literatury v knihovnách, ale stále více jej využívají také archivy, muzea, projekty a webové aplikace . Spravuje ji Německá národní knihovna (DNB), všechny německy mluvící knihovnické spolky , databáze časopisů(ZDB) a mnoha dalších institucí. Autoritní data usnadňují katalogizaci, nabízejí přehledné vyhledávací přístupové body a možnost propojení různých informačních zdrojů.
Dne 19. dubna 2012 GND nahradilo dříve samostatné soubory autorit Personal Name File (PND), Common Corporate Body File (GKD), Keyword Authority File (SWD) a soubor jednotného názvu předmětu německého hudebního archivu (DMA-EST soubor). Od července 2014 jsou autoritní data zaznamenávána podle pravidel RDA , která mimo jiné používá i Kongresová knihovna . [1]
Soubor společných autorit byl vyvíjen v letech 2009 až 2012 ve společném projektu Německé národní knihovny, sítí německy psaných knihoven a databáze časopisů. Cílem projektu bylo sloučit dříve samostatně spravované autoritní soubory GKD, PND a SWD a soubor DMA-EST. Měl by být zaveden společný datový formát a měly by být harmonizovány stávající rozdíly v předpisech.
Vytváření autoritních záznamů bývalo založeno na různých souborech pravidel. Jednalo se o „ Pravidla pro abecední katalogizaci “ (RAK-WB a RAK-Musik) pro formální indexování a „ Pravidla pro katalogizaci klíčových slov “ (RSWK) pro indexování obsahu .. Nejednotná pravidla pro vytvoření preferovaného označení pro formální a obsahovou indexaci vedla k nadbytečným datovým souborům v GKD a SWD, zejména v oblasti korporací, kongresů a geografických materiálů. Proto byla pro GND vypracována přechodná pravidla pro případy, kdy se pravidla formální a obsahové indexace od sebe odchylují, což umožňuje společné používání autoritních datových záznamů. Přechodná pravidla již v co největší míře zohledňují předpisy RDA ( Resource Description and Access ) .
Datové formáty autoritních souborů, jak interní, tak výměnné formáty, se také v některých případech značně lišily. Formát výměny GND je založen na MARC 21 Authority. Sloučením všech záznamů autoritních dat v GND by mohly být překonány dříve existující rozdíly ve formátu. Existující paralelní datové sady z různých souborů oprávnění však lze sloučit pouze v průběhu času.
V projektu Virtual International Authority File (VIAF) je GND virtuálně kombinován s jinými soubory autorit a tvoří tak soubor mezinárodních autorit.
Data se skládají z entit a prohlášení o nich. Každá entita má typ entity a alespoň jeden identifikátor.
Každý záznam popisuje entitu.
Zde uvedené typy entit odpovídají tzv. typům záznamů ( typ datového záznamu ) v knihovnách .
Ve společném autoritním souboru jedinečné identifikační číslo (IDN nebo PPN; základ pro Uniform Resource Identifier v produkčním systému), standardizovaný preferovaný termín (dříve také: autorizovaná forma ), různé formy jmen (synonyma) a různé popisné atributy jsou zaznamenány pro každý popis entity . Pokud je to možné, jsou atributy uloženy jako vztahy k jiným záznamům autoritních dat, přičemž typ vztahu je v každém případě zakódován. [2]Příklady souvisejících atributů jsou místa narození a úmrtí lidí a jejich povolání. Pro korporace, např. Jsou specifikovány vztahy předchůdce a nástupce, ale i správní nadřízení. V případě předmětových termínů jsou obecné termíny a související termíny propojeny. To znamená, že literaturu k souvisejícím tématům lze nalézt i při vyhledávání v katalogu knihovny. Bohaté a přesné sémantické a tematické (v závislosti na předmětu také: dogmaticky orientované) vzájemné zpracování záznamů GND prospívá kvalitě vyhledávání .
Tímto způsobem je vytvořena sémantická síť souvisejících datových sad ( linkovaná data ), která je vhodná zejména pro použití na webu, umožňuje navigaci v rámci souboru autorit a zlepšuje tak možnosti vyhledávání pro uživatele.
Na konci srpna 2019 bylo ukončeno používání Tn vět pro osobní jména. [3] O rok později, k 19. červnu 2020, byly vazby mezi záznamy Tn v bibliografických údajích zpětně vymazány. Důvodem byla převážně špatná kvalita Tn vět. Mnohé byly pouze na velmi nízké úrovni katalogizace. Často nebylo jasné, které osobě lze soubor dat přiřadit, takže údaje nebyly jednoznačné. Byly zde duplikáty a nesprávné odkazy na bibliografické údaje. Místo odkazů jsou nyní v bibliografických údajích pouze textové řetězce. Od července 2020 již nejsou záznamy jmen součástí společného souboru autorit. [4]
Kromě osobních jmen lze každý typ záznamu dále odlišit zadáním kódu entity [5] . Geografickou entitou může být například stát nebo budova. K dispozici je celkem šest typů entit, které jsou rozděleny do přibližně 50 podtypů.
kód | definice [6] |
---|---|
G | zeměpis |
dát | Budovy a stavební soubory, monumentální sochy, pomníky, hrobky atd. dle RSWK §730.1 |
gif; gik | členské státy (jsou vždy dvojitě kódovány s „gik“) |
gik | místní úřady a správní jednotky |
gil; gik | Země, státy (nezávislé) (jsou vždy dvojitě kódovány „gik“) |
gin | Přirozeně geografické jednotky, biogeografické a paleografické jednotky, názvy geografických podcelků se světovými stranami nebo s jinými výrazy podle RSWK § 205, 1 a 2 |
gio | Geografické údaje v malém měřítku v rámci lokality, s výjimkou budov a souborů budov |
dívka; gik | Duchovní říšská knížectví (do roku 1803), správní jednotky východní církve (vždy jsou dvojitě kódovány „gik“) |
dávat; gik | Správní jednotky, které podle EH-G-03 dostávají okamžitý druhový termín z druhového termínu správní jednotky (jsou vždy dvojitě kódovány "gik") |
giw | Hranice, cesty, čáry |
gix | estraterrestrica |
giz | Všechny zeměpisné názvy, které nelze přiřadit k žádnému z dalších podtypů subjektů, regionů a oblastí dle RSWK § 204a, včetně okolí jednotlivých měst a obcí |
gxz | Smyšlená místa |
k | korporací |
kif | Společnosti (od ledna 2016) |
kim | Hudební tělesa (od ledna 2016) |
kio | orgány místních úřadů |
kip | Projekty a plány a programy podobné projektům |
kiv; kir | Náboženské správní jednotky (např. diecéze katolické církve; výjimka: správní jednotky východní církve, správní jednotky východní církve jsou kódovány „gir“ a „gik“) (vždy jsou dvojitě kódovány „kir“) (od ledna 2016 ) |
kiz | Všechny ostatní právnické osoby, které nepatří do žádného jiného zvláštního typu subjektu |
kxz | Fiktivní entity |
p | osob |
pif | rodiny |
pik | Vládnoucí knížata, členové vládnoucích knížecích rodů |
pip | pseudonymy |
čurat | kolektivní pseudonymy |
piz | Osobní jména, která nepatří k žádnému jinému zvláštnímu typu entity |
pxg | bohové |
pxl | Literární postavy, legendární postavy |
pxs | duchy |
s | technické termíny |
sab; soz | Hudební instrumentace (podle RDA 6.15) (vždy jsou dvojitě kódovány "saz") (od ledna 2016) |
smutný; soz | Datové nosiče (podle RDA 3.4.1.3 DA-CH) (jsou vždy dvojitě kódovány "saz") |
bezpečný; soz | Formulářové informace o typu obsahu (podle RDA 7.2.1.3 DA-CH) (jsou vždy dvojitě kódovány "saz") |
říci; soz | Hudební žánr (podle RDA 6.14.2.5.2 DA-CH) (jsou vždy dvojitě kódovány "saz") (od ledna 2016) |
sam; soz | Forma hudebního výstupu (podle RDA 7.20.1.3 DA-CH) (jsou vždy dvojitě kódovány "saz") |
soz | obecné termíny, tj. H. všechna předmětová hesla, která nepatří žádnému jinému zvláštnímu typu entity |
vy | etnografická |
sif | Dopravní prostředky s jednotlivými názvy |
vidět | Historické jednotlivé události |
doušek | Produkty a názvy značek jiné než softwarové produkty („siw“) |
sis | Jazyky |
Ahoj | Skupiny lidí, kteří nejsou právnickými osobami |
sw | softwarových produktů |
velikost | Všechny jednotlivé skutečnosti, které jsou evidovány jako předmětové pojmy a nelze je přiřadit k žádnému z dalších podtypů subjektů, např. B. Soutěže |
slz | Písmena, morfémy, slova jako objekty lingvistického zkoumání |
snz | Názvosloví biologie – chemie |
sxz | Smyšlené termíny |
szz | Všechny případy pochybností pro všechny subjekty |
a | |
uiz | Nekorporace (pouze ve starších datech) |
proti | konference a akce |
ví | konference, akce |
vif | Konferenční sekvence nebo série, sekvence událostí nebo série w |
w | továrny |
znovu | tiskařské značky |
jak | výraz |
wif | Verze hudebního díla (od července 2014 ukončeno) |
wim | hudební díla |
vyhrát | sbírky |
otřít | vlastnosti provenience |
znát | písemné památky |
vtip | továrny |
Každou entitu lze jednoznačně identifikovat alespoň jedním identifikátorem (GND-ID). Každý identifikátor se skládá ze znaků 0 až 9, X a pomlčky. Identifikátor entity typu p se skládá z 9 nebo 10 znaků, vždy začíná 1 následovanou 8 nebo 9 číslicemi a končí kontrolním znakem 0-9 nebo X.
Každý záznam je spojen s úrovní katalogizace mezi 1 a 6. Čím nižší číslo, tím vyšší úroveň zadání GND a tím lépe zpracovaný soubor dat. Standardem při vytváření nového záznamu osobních údajů je zpočátku úroveň 3 (Tp3).
Preferované označení je vždy založeno na dílech uvedených v „ Seznamu technických referenčních děl pro soubor Common Authority File “. [7] Preferované pojmenování předmětových termínů v GND se řídí obecným zvykem, jak se používá v encyklopediích ( Brockhaus , Meyer , případně také Wikipedie) je zjistitelný; ve výjimečných případech se používají termíny z odborného žargonu. Synonyma mohou být v heslech obsažena jako varianty nebo tzv. kvazi-synonyma. Dokud není k tématu dostatek názvů, nejprve se pokusíme vyjádřit nová fakta kombinací několika již dostupných předmětových termínů v posloupnosti klíčových slov, aby se pokud možno předešlo novým záznamům (tzv. kontrola rozkladu). Tím je zachována kontinuita s heslem tématu ve starší literatuře, takže lze vytvořit odkaz na starší tituly. Teprve když literatura k tématu dosáhne určitého rozsahu, zavádí se nový odborný termín. Pokud se používání jazyka změní, preferovaný termín lze upravit.
Množství lze nalézt ve výročních zprávách DNB a výpisech dat GND [8] .
Soubor Common Authority File obsahuje přibližně 8,9 milionu záznamů (k 13. červnu 2021) následujících typů entit :
typ entity / datum | zdroj | lidé (individualizovaní) |
Osobní jména (ne individualizovaná) |
Osoby a osobní jména (celkem) |
korporací | konference a akce |
zeměpis | technické termíny | továrny | celkový |
---|---|---|---|---|---|---|---|---|---|---|
kód entity | -- | p | n | -- | k | proti | G | s | w | -- |
červen 2013 | ? | 2 882 000 | 4 628 000 | (7 510 000) | 1 172 000 | 587 000 | 293 000 | 202 000 | 193 000 | (9 957 000) |
2015 | Výroční zpráva [9] | žádné informace | žádné informace | 8,669,790 | 1,240,852 | 619,610 | 289,449 | 205 586 | 244 480 | 11,269,767 |
2016 | Výroční zpráva [10] | žádné informace | žádné informace | 10,546,959 | 1,498,606 | 769,067 | 295 027 | 207,149 | 287,204 | 13.604.012 |
2017 | Výroční zpráva [11] | žádné informace | žádné informace | 11,551,274 | 1,493,823 | 786,180 | 300 138 | 209,003 | 331,310 | 14,671,728 |
2018 | Výroční zpráva [12] | žádné informace | žádné informace | 12.032.087 | 1,487,938 | 803 612 | 305,543 | 211,339 | 367,574 | 15.208.093 |
2019 | Výroční zpráva [13] | žádné informace | žádné informace | 12,265,826 | 1,490,830 | 826,579 | 310 860 | 212,775 | 405 899 | 15,512,769 |
února 2020 | LDS [14] | 5,251,171 | 7,046,133 | 12,297,304 | 1,491,072 | 829,548 | 311,357 | 212 895 | 410,736 | 15,552,912 |
června 2020 | LDS [15] | 5,350,953 | vypadla | (5 350 953) | 1,491,358 | 836,410 | 313 058 | 213,257 | 425,718 | 8,630,754 |
13. října 2020 | LDS [16] | 5,421,947 | vypadla | (5 421 947) | 1,490,757 | 842,725 | 314,492 | 213,528 | 442,181 | 8,725,630 |
2020 | Výroční zpráva [17] | 5,467,413 | žádné informace | žádné informace | 1,493,057 | 846,449 | 315,389 | 213 655 | 451,414 | 8,787,377 |
13. února 2021 | LDS [18] | 5,496,766 | vypadla | (5 496 766) | 1,495,527 | 848,846 | 315,924 | 213,779 | 456,893 | 8,827,735 |
13. června 2021 | LDS [19] | 5,574,687 | vypadla | (5 574 687) | 1,501,942 | 854,637 | 317 093 | 203,371 | 468,720 | 8,920,450 |
23. října 2021 | LDS [20] | 5,650,830 | vypadla | (5 650 830) | 1,507,546 | 854,539 | 318,392 | 203,801 | 479,558 | 9,014,666 |
K 13. červnu 2021 je na open.dnb.de/opendata publikováno 465 790 záznamů vychýlení ve formátu RDF (JSON-LD). To znamená, že na některé datové záznamy lze odkazovat pomocí několika GND identifikátorů.
datum | číslo | anotace |
---|---|---|
13. 4. 2021 | 461,335 | |
13. 6. 2021 | 465 790 | |
13. 11. 2021 | 472,485 | GND, vychylovací sady bez Tu |
K 13. červnu 2021 13:20 UTC obsahují soubory „authorities_lds“ 163 131 042 trojic v 8 920 450 záznamech. [21]
čas | evidence | trojnásobný |
---|---|---|
13.06.2021 13:20 UTC | 8,920,450 | 163.131.042 |
13. 10. 2021 12:20 UTC | 9,014,666 | 165,639,860 |
Společná složka autority je uložena v Německé národní knihovně. Sítě knihoven jednou importovaly základní fond GND do svých síťových systémů a od té doby získaly aktualizace souboru autorit prostřednictvím procesu OAI . GND je editován a rozšiřován nejen knihovnami, ale také archivy (zatím především vědeckými a literárními), muzei a editory referenčních prací. Spolupráce probíhá buď prostřednictvím knihovnických spolků nebo po konzultaci s Německou národní knihovnou. Využívání státními a městskými archivy je teprve na začátku (stav 2015).
Data autority GND jsou zdarma k dispozici na webu DNB ve formátech MARC 21 Authority, MARC21-xml a RDFxml pod licencí CC0 1.0 .
V prosinci 2012 byl zahájen projekt spolupráce mezi Německou národní knihovnou (DNB) a Německým filmovým institutem (DIF) pod názvem Cross- Institutional Integration of Norm Data (IN2N). Cílem projektu financovaného Německou výzkumnou nadací (DFG) je podpořit neknihovnické instituce ve využívání GND a zapojit je do indexace. [22] V rámci projektu byly mimo jiné porovnány soubory dat z filmportal.de s osobními články z Wikipedie . [23]
Na konci roku 2014 byla do GND importována standardní data z DIF. V předchozích měsících již byla do GND převedena mimo jiné data z Ibero-amerického institutu (Berlín) a Výzkumného centra pro východní Evropu na univerzitě v Brémách. Od 6. května 2016 mohou wikipedisté, kteří se zúčastnili příslušného školení, vytvářet autoritní data pro jednotlivce pomocí „webového formuláře GND“. Odpovídající identifikátor knihovny je Wikimedia Germany (DE-B1592).