Plik wspólnego urzędu | |
---|---|
| |
założenie | 2012 |
Czas trwania | 8920450 |
Lokalizacja | Frankfurt nad Menem |
ISIL | EN-588 |
operator | Niemiecka Biblioteka Narodowa i inne |
strona | https://gnd.network |
Common Authority File ( GND ) to plik uprawnień dla osób , korporacji , kongresów , materiałów geograficznych , nagłówków tematycznych i tytułów prac , który jest używany głównie do katalogowania literatury w bibliotekach, ale jest również coraz częściej używany przez archiwa, muzea, projekty i aplikacje internetowe . Jest zarządzana przez Niemiecką Bibliotekę Narodową (DNB), wszystkie niemieckojęzyczne stowarzyszenia biblioteczne , bazę danych czasopism(ZDB) i wiele innych instytucji. Dane urzędowe ułatwiają katalogowanie, oferują przejrzyste punkty dostępu do wyszukiwania oraz możliwość łączenia różnych zasobów informacyjnych.
19 kwietnia 2012 r. GND zastąpiło wcześniej oddzielne pliki uprawnień Personal Name File (PND), Common Corporate Body File (GKD), Keyword Authority File (SWD) i jednolity plik tytułów tematu Niemieckiego Archiwum Muzycznego (DMA-EST). plik). Od lipca 2014 roku dane urzędowe są rejestrowane zgodnie z zasadami RDA , z których korzysta m.in. Biblioteka Kongresu . [1]
Plik wspólnych organów został opracowany w latach 2009–2012 we wspólnym projekcie Niemieckiej Biblioteki Narodowej, niemieckojęzycznej sieci bibliotecznej i bazy danych czasopism. Celem projektu było połączenie wcześniej oddzielnie zarządzanych plików urzędów GKD, PND i SWD oraz pliku DMA-EST. Należy wdrożyć wspólny format danych i zharmonizować istniejące różnice w przepisach.
Kiedyś tworzenie rekordów uprawnień opierało się na różnych zestawach reguł. Były to „ Zasady katalogowania alfabetycznego ” (RAK-WB i RAK-Musik) dotyczące formalnego indeksowania oraz „ Zasady katalogowania słów kluczowych ” (RSWK) dotyczące indeksowania treści .. Niespójne zasady tworzenia preferowanego oznaczenia dla indeksacji formalnej i merytorycznej doprowadziły do zbędnych zbiorów danych w GKD i SWD, zwłaszcza w obszarze organów korporacyjnych, kongresów i materiałów geograficznych. W związku z tym opracowano zasady przejściowe dla GND dla przypadków, w których zasady indeksacji formalnej i merytorycznej odbiegają od siebie, co umożliwia wspólne korzystanie z rekordów danych urzędu. Przepisy przejściowe uwzględniają już w miarę możliwości przepisy RDA ( opis zasobów i dostęp ) .
Formaty danych z akt urzędowych, zarówno formaty wewnętrzne, jak i formaty wymiany, również w niektórych przypadkach znacznie się różniły. Format wymiany GND jest oparty na Urzędzie MARC 21 . Łącząc wszystkie rekordy danych uprawnień w GND, można wyeliminować istniejące wcześniej różnice w formatach. Jednak istniejące równoległe zestawy danych z różnych zbiorów uprawnień można scalić dopiero po pewnym czasie.
W projekcie Virtual International Authority File (VIAF) GND jest wirtualnie łączony z innymi plikami autorytetów w celu utworzenia międzynarodowego pliku autoryzacji.
Dane składają się z podmiotów i oświadczeń o nich. Każda jednostka ma typ jednostki i co najmniej jeden identyfikator.
Każdy rekord opisuje jednostkę.
Wymienione tutaj typy jednostek odpowiadają tak zwanym typom rekordów ( typ rekordu danych ) w bibliotekach .
W zbiorze urzędów powszechnych unikalny numer identyfikacyjny (IDN lub PPN; podstawa Uniform Resource Identifier w systemie produkcyjnym), ustandaryzowany termin preferowany (dawniej także: autoryzowana forma ), różne formy nazw (synonimy) oraz różne atrybuty opisowe są rejestrowane dla każdego opisu podmiotu . Jeśli to możliwe, atrybuty są przechowywane jako relacje z innymi rekordami danych urzędu, przy czym w każdym przypadku kodowany jest typ relacji. [2]Przykładami powiązanych atrybutów są miejsca narodzin i śmierci ludzi oraz ich zawody. Dla korporacji m.in. Określono relacje poprzedników i następców, ale także nadrzędnych administracyjnych. W przypadku terminów przedmiotowych terminy ogólne i terminy pokrewne są połączone. Oznacza to, że literaturę na tematy pokrewne można znaleźć również przeszukując katalog biblioteczny. Bogate i dokładne semantyczne i tematyczne (w zależności od tematu także: zorientowane dogmatycznie ) przetwarzanie wpisów GND względem siebie wpływa na jakość wyszukiwania .
W ten sposób tworzona jest semantyczna sieć powiązanych zestawów danych ( dane połączone ), która jest szczególnie odpowiednia do wykorzystania w Internecie, umożliwia nawigację w pliku urzędu, a tym samym poprawia opcje wyszukiwania dla użytkowników.
Pod koniec sierpnia 2019 r. zaprzestano używania zdań Tn dla nazwisk. [3] Rok później, od 19 czerwca 2020 r., powiązania między rekordami Tn w danych bibliograficznych zostały retrospektywnie usunięte. Powodem tego była przeważnie słaba jakość zdań Tn. Wiele z nich było na bardzo niskim poziomie katalogowania. Często nie było jasne, do której osoby można przypisać zbiór danych, więc dane nie były jednoznaczne. Były duplikaty i nieprawidłowe linki do danych bibliograficznych. Zamiast linków w danych bibliograficznych znajdują się teraz tylko ciągi tekstowe. Od lipca 2020 r. rekordy nazwisk nie są już częścią zbioru urzędu wspólnego. [4]
Oprócz nazwisk, każdy typ rekordu może być dodatkowo różnicowany poprzez podanie kodu podmiotu [5] . Na przykład jednostką geograficzną może być stan lub budynek. W sumie dostępnych jest sześć typów encji, które są podzielone na około 50 podtypów.
kod | definicja [6] |
---|---|
G | geografia |
dawać | Budynki i zespoły budowlane, rzeźby monumentalne, pomniki, grobowce itp. wg RSWK §730.1 |
gif; gik | Państwa członkowskie (zawsze są zakodowane podwójnie z „gik”) |
gik | władze lokalne i jednostki administracyjne |
gil; gik | Kraje, stany (niezależne) (zawsze są zakodowane podwójnie przez „gik”) |
Gin | Naturalne jednostki geograficzne, jednostki biogeograficzne i paleograficzne, nazwy podjednostek geograficznych z punktami kardynalnymi lub innymi wyrażeniami zgodnie z RSWK § 205, 1 i 2 |
Gio | Obszary geograficzne na małą skalę w obrębie lokalizacji, z wyjątkiem budynków i zespołów budynków |
Gir; gik | Duchowe księstwa cesarskie (do 1803), jednostki administracyjne Kościoła wschodniego (zawsze są one podwójnie kodowane „gik”) |
dać; gik | Jednostki administracyjne, które zgodnie z EH-G-03 otrzymują natychmiastowy termin ogólny z ogólnego terminu jednostki administracyjnej (są one zawsze podwójnie kodowane z „gik”) |
giwi | Granice, ścieżki, linie |
gix | estraterrestrica |
giz | Wszystkie nazwy geograficzne, których nie można przypisać do żadnego z pozostałych podtypów, regionów i obszarów zgodnie z RSWK § 204a, w tym okolice poszczególnych miast i gmin |
gxz | Fikcyjne miejsca |
k | korporacje |
kif | Firmy (od stycznia 2016) |
kim | Organy muzyczne (stan na styczeń 2016) |
Kio | organy samorządu terytorialnego |
wyrko | Projekty i plany i programy podobne do projektów |
kiw; Kiri | Religijne jednostki administracyjne (np. diecezje Kościoła katolickiego; wyjątek: jednostki administracyjne Kościoła wschodniego, jednostki administracyjne Kościoła wschodniego są kodowane „gir” i „gik”) (zawsze są kodowane podwójnie przez „kir”) (stan na styczeń 2016 r. ) |
Kizi | Wszystkie inne osoby prawne, które nie należą do żadnego innego szczególnego rodzaju podmiotu |
kxz | Fikcyjne byty |
p | osoby |
pif | Rodziny |
pik | Panujący książęta, członkowie rządzących rodów książęcych |
pypeć | pseudonimy |
robić siku | pseudonimy zbiorowe |
pizzy | Nazwiska osobiste, które nie należą do żadnego innego specjalnego typu bytów |
pxg | bogowie |
piksel | Postacie literackie, postacie legendarne |
pxs | duchy |
s | terminy techniczne |
szabla; soz | Instrumentacja muzyczna (zgodnie z RDA 6.15) (zawsze są one podwójnie kodowane „saz”) (stan na styczeń 2016) |
smutny; soz | Nośniki danych (zgodnie z RDA 3.4.1.3 DA-CH) (zawsze są podwójnie kodowane „saz”) |
bezpieczny; soz | Formularz informacji o rodzaju treści (zgodnie z RDA 7.2.1.3 DA-CH) (zawsze są one podwójnie zakodowane „saz”) |
mówić; soz | Gatunek muzyczny (zgodnie z RDA 6.14.2.5.2 DA-CH) (są zawsze podwójnie zakodowane z „saz”) (stan na styczeń 2016) |
sam; soz | Forma wyjścia muzycznego (zgodnie z RDA 7.20.1.3 DA-CH) (zawsze są one podwójnie kodowane „saz”) |
soz | warunki ogólne, tj. H. wszystkie nagłówki tematyczne, które nie należą do żadnego innego specjalnego typu encji |
ty | etnograficzny |
sif | Środki transportu z indywidualnymi nazwami |
Widzieć | Historyczne wydarzenia indywidualne |
łyk | Produkty i nazwy marek inne niż oprogramowanie („siw”) |
siostra | Języki |
Siema | Grupy osób niebędących osobami prawnymi |
południowy zachód | produkty oprogramowania |
rozmiar | Wszystkie indywidualne fakty, które są zapisane jako terminy przedmiotowe i nie mogą być przypisane do żadnego z innych podtypów encji, np. B. Zawody |
slz | Litery, morfemy, słowa jako przedmioty badań językowych |
snz | Nomenklatura Biologia – Chemia |
sxz | Terminy fikcyjne |
szzi | Wszystkie przypadki wątpliwości dla wszystkich podmiotów |
oraz | |
uiz | Osoby niebędące korporacjami (tylko w starszych danych) |
v | konferencje i wydarzenia |
współzawodniczyć | konferencje, eventy |
wifi | Sekwencje lub seriale konferencyjne, sekwencje lub serie wydarzeń w |
w | fabryki |
ponownie | znaki drukarskie |
Jak | wyrażenie |
żona | Wersja utworu muzycznego (wycofana od lipca 2014) |
wim | dzieła muzyczne |
wygrać | kolekcje |
wytrzeć | cechy pochodzenia |
wiedzieć | pomniki pisane |
dowcip | fabryki |
Każdy podmiot można jednoznacznie zidentyfikować za pomocą co najmniej jednego identyfikatora (GND-ID). Każdy identyfikator składa się ze znaków od 0 do 9, X i myślnika. Identyfikator podmiotu typu podmiotu p składa się z 9 lub 10 znaków, zawsze zaczyna się od 1, po którym następuje 8 lub 9 cyfr i kończy się znakiem kontrolnym 0-9 lub X.
Każdy rekord jest powiązany z poziomem katalogowania od 1 do 6. Im niższa liczba, tym wyższy poziom wpisu GND i tym lepiej przetworzony zbiór danych. Standardem przy tworzeniu nowego rekordu danych osobowych jest początkowo poziom 3 (Tp3).
Preferowane oznaczenie jest zawsze oparte na pracach wymienionych w „ Wykazie technicznych prac referencyjnych do akt wspólnego organu ”. [7] Preferowane nazewnictwo terminów przedmiotowych w GND jest zgodne z ogólnym użyciem, tak jak jest używane w encyklopediach ( Brockhaus , Meyer , alternatywnie także Wikipedia) jest wykrywalny; w wyjątkowych przypadkach stosuje się terminy z żargonu technicznego. Synonimy mogą być zawarte we wpisach jako warianty lub tak zwane quasi-synonimy. Dopóki nie ma wystarczającej liczby tytułów na dany temat, najpierw podejmuje się próbę wyrażenia nowych faktów poprzez połączenie kilku już dostępnych terminów tematycznych w sekwencję słów kluczowych, aby w miarę możliwości uniknąć nowych wpisów (tzw. kontrola rozkładu). Zachowuje to ciągłość ze słowami kluczowymi tematu w starszej literaturze, dzięki czemu można ustalić odniesienie do starszych tytułów. Dopiero gdy literatura na dany temat osiągnie pewien zakres, wprowadza się nowy termin techniczny. Jeśli użycie języka ulegnie zmianie, preferowany termin można dostosować.
Ilości można znaleźć w rocznych sprawozdaniach DNB i wyciągach z danych GND [8] .
Common Authority File zawiera około 8,9 miliona rekordów (stan na 13 czerwca 2021 r.) następujących typów jednostek :
typ podmiotu / data | źródło | ludzie (zindywidualizowani) |
Nazwiska (nie zindywidualizowane) |
Osoby i nazwiska (ogółem) |
korporacje | konferencje i wydarzenia |
geografia | terminy techniczne | fabryki | całkowity |
---|---|---|---|---|---|---|---|---|---|---|
kod podmiotu | -- | p | n | -- | k | v | G | s | w | -- |
czerwiec 2013 | ? | 2 882 000 | 4 628 000 | (7 510 000) | 1172 000 | 587 000 | 293 000 | 202 000 | 193 000 | (9 957 000) |
2015 | Raport roczny [9] | brak informacji | brak informacji | 8 669 790 | 1 240 852 | 619,610 | 289 449 | 205 586 | 244 480 | 11 269 767 |
2016 | Raport roczny [10] | brak informacji | brak informacji | 10 546 959 | 1 498 606 | 769 067 | 295 027 | 207 149 | 287,204 | 13.604.012 |
2017 | Raport roczny [11] | brak informacji | brak informacji | 11.551.274 | 1 493 823 | 786 180 | 300,138 | 209.003 | 331,310 | 14 671 728 |
2018 | Raport roczny [12] | brak informacji | brak informacji | 12.032.087 | 1 487 938 | 803,612 | 305,543 | 211 339 | 367 574 | 15.208.093 |
2019 | Raport roczny [13] | brak informacji | brak informacji | 12 265 826 | 1 490 830 | 826 579 | 310 860 | 212 775 | 405 899 | 15 512 769 |
Luty 2020 | LDS [14] | 5 251 171 | 7046,133 | 12 297 304 | 1 491 072 | 829 548 | 311 357 | 212 895 | 410 736 | 15.552.912 |
czerwiec 2020 | LSR [15] | 5 350 953 | odpadło | (5 350 953) | 1 491 358 | 836 410 | 313,058 | 213 257 | 425 718 | 8 630 754 |
13 paź 2020 | LSR [16] | 5 421 947 | odpadło | (5 421 947) | 1 490 757 | 842 725 | 314 492 | 213 528 | 442.181 | 8 725 630 |
2020 | Raport roczny [17] | 5 467 413 | brak informacji | brak informacji | 1 493 057 | 846,449 | 315 389 | 213,655 | 451414 | 8 787 377 |
13 lut 2021 | LSR [18] | 5 496 766 | odpadło | (5 496 766) | 1 495 527 | 848,846 | 315 924 | 213 779 | 456,893 | 8 827 735 |
13 czerwca 2021 | LSR [19] | 5574687 | odpadło | (5,574,687) | 1 501942 | 854 637 | 317 093 | 203 371 | 468 720 | 8920450 |
23 paź 2021 | LSR [20] | 5650 830 | odpadło | (5650830) | 1 507 546 | 854,539 | 318 392 | 203.801 | 479 558 | 9 014 666 |
Na dzień 13 czerwca 2021 r. na open.dnb.de/opendata opublikowano 465 790 rekordów ugięcia w formacie RDF (JSON-LD). Oznacza to, że do niektórych rekordów danych można się odwoływać za pomocą kilku identyfikatorów GND.
data | numer | adnotacja |
---|---|---|
13.04.2021 | 461,335 | |
13.06.2021 | 465 790 | |
13.11.2021 | 472 485 | GND, zestawy odchylające bez Tu |
Według stanu na 13 czerwca 2021 r. 13:20 czasu UTC pliki „authorities_lds” zawierają 163 131 042 trójki w 8920450 rekordach. [21]
czas | dokumentacja | potroić |
---|---|---|
13.06.2021 13:20 UTC | 8920450 | 163.131.042 |
2021-10-13 12:20 UTC | 9 014 666 | 165,639,860 |
Akta organu wspólnego są przechowywane w Niemieckiej Bibliotece Narodowej. Sieci biblioteczne zaimportowały jeden raz zasoby podstawowe GND do swoich systemów sieciowych i od tego czasu uzyskały aktualizacje do pliku uprawnień za pośrednictwem procesu OAI . GND redagują i rozbudowują nie tylko biblioteki, ale także archiwa (do tej pory przede wszystkim archiwa naukowe i literackie), muzea i redaktorzy opracowań. Współpraca odbywa się za pośrednictwem stowarzyszeń bibliotecznych lub po konsultacji z Niemiecką Biblioteką Narodową. Korzystanie z archiwów państwowych i miejskich dopiero się rozpoczyna (stan na 2015 r.).
Dane urzędu GND są dostępne bezpłatnie na stronie DNB w formatach MARC 21 Authority, MARC21-xml i RDFxml na licencji CC0 1.0 .
W grudniu 2012 r. rozpoczął się projekt współpracy pomiędzy Niemiecką Biblioteką Narodową (DNB) a Niemieckim Instytutem Filmowym (DIF) pod nazwą Międzyinstytucjonalna integracja danych norm (IN2N). Celem projektu, finansowanego przez German Research Foundation (DFG), jest wsparcie instytucji pozabibliotecznych w korzystaniu z GND i zaangażowanie ich w indeksowanie. [22] Między innymi w ramach projektu porównano zbiory danych z filmportal.de z osobistymi artykułami z Wikipedii . [23]
Pod koniec 2014 roku standardowe dane z DIF zostały zaimportowane do GND. W poprzednich miesiącach dane m.in. z Ibero-American Institute (Berlin) i Research Center for Eastern Europe na Uniwersytecie w Bremie były już przekazywane do GND. Od 6 maja 2016 r. Wikipedyści, którzy wzięli udział w odpowiednich szkoleniach, mogą tworzyć dane autorytetów dla osób korzystających z „formularza internetowego GND”. Odpowiedni identyfikator biblioteki to Wikimedia Germany (DE-B1592).