Polski

Plik wspólnego urzędu

Plik wspólnego urzędu

Z Wikipedii, wolnej encyklopedii
Skocz do nawigacji Skocz do wyszukiwania

Common Authority File ( GND ) to plik uprawnień dla osób , korporacji , kongresów , materiałów geograficznych , nagłówków tematycznych i tytułów prac , który jest używany głównie do katalogowania literatury w bibliotekach, ale jest również coraz częściej używany przez archiwa, muzea, projekty i aplikacje internetowe . Jest zarządzana przez Niemiecką Bibliotekę Narodową (DNB), wszystkie niemieckojęzyczne stowarzyszenia biblioteczne , bazę danych czasopism(ZDB) i wiele innych instytucji. Dane urzędowe ułatwiają katalogowanie, oferują przejrzyste punkty dostępu do wyszukiwania oraz możliwość łączenia różnych zasobów informacyjnych.

19 kwietnia 2012 r. GND zastąpiło wcześniej oddzielne pliki uprawnień Personal Name File (PND), Common Corporate Body File (GKD), Keyword Authority File (SWD) i jednolity plik tytułów tematu Niemieckiego Archiwum Muzycznego (DMA-EST). plik). Od lipca 2014 roku dane urzędowe są rejestrowane zgodnie z zasadami RDA , z których korzysta m.in. Biblioteka Kongresu . [1]

podstawy

Przykładowe dane osobowe (zrzut ekranu, maj 2012)

Plik wspólnych organów został opracowany w latach 2009–2012 we wspólnym projekcie Niemieckiej Biblioteki Narodowej, niemieckojęzycznej sieci bibliotecznej i bazy danych czasopism. Celem projektu było połączenie wcześniej oddzielnie zarządzanych plików urzędów GKD, PND i SWD oraz pliku DMA-EST. Należy wdrożyć wspólny format danych i zharmonizować istniejące różnice w przepisach.

Kiedyś tworzenie rekordów uprawnień opierało się na różnych zestawach reguł. Były to „ Zasady katalogowania alfabetycznego ” (RAK-WB i RAK-Musik) dotyczące formalnego indeksowania oraz „ Zasady katalogowania słów kluczowych ” (RSWK) dotyczące indeksowania treści .. Niespójne zasady tworzenia preferowanego oznaczenia dla indeksacji formalnej i merytorycznej doprowadziły do ​​zbędnych zbiorów danych w GKD i SWD, zwłaszcza w obszarze organów korporacyjnych, kongresów i materiałów geograficznych. W związku z tym opracowano zasady przejściowe dla GND dla przypadków, w których zasady indeksacji formalnej i merytorycznej odbiegają od siebie, co umożliwia wspólne korzystanie z rekordów danych urzędu. Przepisy przejściowe uwzględniają już w miarę możliwości przepisy RDA ( opis zasobów i dostęp ) .

Formaty danych z akt urzędowych, zarówno formaty wewnętrzne, jak i formaty wymiany, również w niektórych przypadkach znacznie się różniły. Format wymiany GND jest oparty na Urzędzie MARC 21 . Łącząc wszystkie rekordy danych uprawnień w GND, można wyeliminować istniejące wcześniej różnice w formatach. Jednak istniejące równoległe zestawy danych z różnych zbiorów uprawnień można scalić dopiero po pewnym czasie.

W projekcie Virtual International Authority File (VIAF) GND jest wirtualnie łączony z innymi plikami autorytetów w celu utworzenia międzynarodowego pliku autoryzacji.

zawartość

Dane składają się z podmiotów i oświadczeń o nich. Każda jednostka ma typ jednostki i co najmniej jeden identyfikator.

Właściwości rekordu

Każdy rekord opisuje jednostkę.

typy podmiotów

Wymienione tutaj typy jednostek odpowiadają tak zwanym typom rekordów ( typ rekordu danych ) w bibliotekach .

W zbiorze urzędów powszechnych unikalny numer identyfikacyjny (IDN lub PPN; podstawa Uniform Resource Identifier w systemie produkcyjnym), ustandaryzowany termin preferowany (dawniej także: autoryzowana forma ), różne formy nazw (synonimy) oraz różne atrybuty opisowe są rejestrowane dla każdego opisu podmiotu . Jeśli to możliwe, atrybuty są przechowywane jako relacje z innymi rekordami danych urzędu, przy czym w każdym przypadku kodowany jest typ relacji. [2]Przykładami powiązanych atrybutów są miejsca narodzin i śmierci ludzi oraz ich zawody. Dla korporacji m.in. Określono relacje poprzedników i następców, ale także nadrzędnych administracyjnych. W przypadku terminów przedmiotowych terminy ogólne i terminy pokrewne są połączone. Oznacza to, że literaturę na tematy pokrewne można znaleźć również przeszukując katalog biblioteczny. Bogate i dokładne semantyczne i tematyczne (w zależności od tematu także: zorientowane dogmatycznie ) przetwarzanie wpisów GND względem siebie wpływa na jakość wyszukiwania .

W ten sposób tworzona jest semantyczna sieć powiązanych zestawów danych ( dane połączone ), która jest szczególnie odpowiednia do wykorzystania w Internecie, umożliwia nawigację w pliku urzędu, a tym samym poprawia opcje wyszukiwania dla użytkowników.

Pod koniec sierpnia 2019 r. zaprzestano używania zdań Tn dla nazwisk. [3] Rok później, od 19 czerwca 2020 r., powiązania między rekordami Tn w danych bibliograficznych zostały retrospektywnie usunięte. Powodem tego była przeważnie słaba jakość zdań Tn. Wiele z nich było na bardzo niskim poziomie katalogowania. Często nie było jasne, do której osoby można przypisać zbiór danych, więc dane nie były jednoznaczne. Były duplikaty i nieprawidłowe linki do danych bibliograficznych. Zamiast linków w danych bibliograficznych znajdują się teraz tylko ciągi tekstowe. Od lipca 2020 r. rekordy nazwisk nie są już częścią zbioru urzędu wspólnego. [4]

podtypy podmiotów

Oprócz nazwisk, każdy typ rekordu może być dodatkowo różnicowany poprzez podanie kodu podmiotu [5] . Na przykład jednostką geograficzną może być stan lub budynek. W sumie dostępnych jest sześć typów encji, które są podzielone na około 50 podtypów.

kodowanie jednostek

identyfikator podmiotu

Każdy podmiot można jednoznacznie zidentyfikować za pomocą co najmniej jednego identyfikatora (GND-ID). Każdy identyfikator składa się ze znaków od 0 do 9, X i myślnika. Identyfikator podmiotu typu podmiotu p składa się z 9 lub 10 znaków, zawsze zaczyna się od 1, po którym następuje 8 lub 9 cyfr i kończy się znakiem kontrolnym 0-9 lub X.

poziom katalogowania

Każdy rekord jest powiązany z poziomem katalogowania od 1 do 6. Im niższa liczba, tym wyższy poziom wpisu GND i tym lepiej przetworzony zbiór danych. Standardem przy tworzeniu nowego rekordu danych osobowych jest początkowo poziom 3 (Tp3).

Stosowanie terminów przedmiotowych

Preferowane oznaczenie jest zawsze oparte na pracach wymienionych w „ Wykazie technicznych prac referencyjnych do akt wspólnego organu ”. [7] Preferowane nazewnictwo terminów przedmiotowych w GND jest zgodne z ogólnym użyciem, tak jak jest używane w encyklopediach ( Brockhaus , Meyer , alternatywnie także Wikipedia) jest wykrywalny; w wyjątkowych przypadkach stosuje się terminy z żargonu technicznego. Synonimy mogą być zawarte we wpisach jako warianty lub tak zwane quasi-synonimy. Dopóki nie ma wystarczającej liczby tytułów na dany temat, najpierw podejmuje się próbę wyrażenia nowych faktów poprzez połączenie kilku już dostępnych terminów tematycznych w sekwencję słów kluczowych, aby w miarę możliwości uniknąć nowych wpisów (tzw. kontrola rozkładu). Zachowuje to ciągłość ze słowami kluczowymi tematu w starszej literaturze, dzięki czemu można ustalić odniesienie do starszych tytułów. Dopiero gdy literatura na dany temat osiągnie pewien zakres, wprowadza się nowy termin techniczny. Jeśli użycie języka ulegnie zmianie, preferowany termin można dostosować.

Zakres

Ilości można znaleźć w rocznych sprawozdaniach DNB i wyciągach z danych GND [8] .

Liczba jednostek według typu jednostki w czasie

Common Authority File zawiera około 8,9 miliona rekordów (stan na 13 czerwca 2021 r.) następujących typów jednostek :

Identyfikatory i zapisy routingu

Na dzień 13 czerwca 2021 r. na open.dnb.de/opendata opublikowano 465 790 rekordów ugięcia w formacie RDF (JSON-LD). Oznacza to, że do niektórych rekordów danych można się odwoływać za pomocą kilku identyfikatorów GND.

potroić

Według stanu na 13 czerwca 2021 r. 13:20 czasu UTC pliki „authorities_lds” zawierają 163 131 042 trójki w 8920450 rekordach. [21]

Użytkowanie i interfejsy

Akta organu wspólnego są przechowywane w Niemieckiej Bibliotece Narodowej. Sieci biblioteczne zaimportowały jeden raz zasoby podstawowe GND do swoich systemów sieciowych i od tego czasu uzyskały aktualizacje do pliku uprawnień za pośrednictwem procesu OAI . GND redagują i rozbudowują nie tylko biblioteki, ale także archiwa (do tej pory przede wszystkim archiwa naukowe i literackie), muzea i redaktorzy opracowań. Współpraca odbywa się za pośrednictwem stowarzyszeń bibliotecznych lub po konsultacji z Niemiecką Biblioteką Narodową. Korzystanie z archiwów państwowych i miejskich dopiero się rozpoczyna (stan na 2015 r.).

Dane urzędu GND są dostępne bezpłatnie na stronie DNB w formatach MARC 21 Authority, MARC21-xml i RDFxml na licencji CC0 1.0 .

Międzyinstytucjonalna integracja danych organów

Połączenie różnych źródeł na temat Franza Beckenbauera przy użyciu formatu BEACON

W grudniu 2012 r. rozpoczął się projekt współpracy pomiędzy Niemiecką Biblioteką Narodową (DNB) a Niemieckim Instytutem Filmowym (DIF) pod nazwą Międzyinstytucjonalna integracja danych norm (IN2N). Celem projektu, finansowanego przez German Research Foundation (DFG), jest wsparcie instytucji pozabibliotecznych w korzystaniu z GND i zaangażowanie ich w indeksowanie. [22] Między innymi w ramach projektu porównano zbiory danych z filmportal.de z osobistymi artykułami z Wikipedii . [23]

Pod koniec 2014 roku standardowe dane z DIF zostały zaimportowane do GND. W poprzednich miesiącach dane m.in. z Ibero-American Institute (Berlin) i Research Center for Eastern Europe na Uniwersytecie w Bremie były już przekazywane do GND. Od 6 maja 2016 r. Wikipedyści, którzy wzięli udział w odpowiednich szkoleniach, mogą tworzyć dane autorytetów dla osób korzystających z „formularza internetowego GND”. Odpowiedni identyfikator biblioteki to Wikimedia Germany (DE-B1592).

literatura

  • Renate Behrens-Neumann: The Common Authority File (GND). Projekt dobiega końca. W: Dialog z bibliotekami. Tom 24, wydanie 1, 2012, ISSN  0936-1138 , s. 25–28, ( PDF; 130 kB ).
  • Eva-Maria Gulder: The Common Authority File (GND). Bawarska Biblioteka Państwowa w Monachium (standardowa edycja danych), wrzesień 2011, ( PDF; 2,84 MB ).
  • Thekla Kluttig: Common Authority i archiwa — po co? W: Clemens Rehm, Monika Storm, Andrea Wettmann (red.): Estates - Nowe drogi tradycji w sieci. Wspólna konferencja wiosenna FG 1 i FG 6 dla wszystkich grup specjalistów w VdA. 7 maja 2013, Archiwum Państwowe Chemnitz (= publikacje Saskiego Archiwum Państwowego. Seria A: katalogi archiwalne, wydania i artykuły specjalistyczne. 17). Mitteldeutscher Verlag, Halle (Saale) 2014, ISBN 978-3-95462-388-4 , s. 85-88.
  • Barbara Pfeifer: Od projektu do działania. Plik wspólnych uprawnień (GND). W: Klaus-Rainer Brintzinger, Ulrich Hohoff (red.): Biblioteki: Bramy do świata wiedzy. 101. Dzień Bibliotekarzy Niemieckich w Hamburgu 2012. Olms, Hildesheim i inni. 2013, ISBN 978-3-487-14888-5 , s. 80-91.
  • Fabian Steeg, Adrian Pohl, Pascal Christoph: lobid-gnd - Interfejs do wspólnego pliku uprawnień dla człowieka i maszyny . W: Praktyka informacyjna . taśma 5 , nie. 1 , 2019, ISSN  2297-3249 , doi : 10.11588/ip.2019.1.52673 ( uni-heidelberg.de ).
  • Brigitte Wiechmann: The Common Authority File (GND). Retrospektywa i perspektywa. W: Dialog z bibliotekami. Tom 24, wydanie 2, 2012, s. 20–22, ( PDF; 465 kB ).

linki internetowe

pozycje

  1. Renate Behrens, Christine Frodl: Pierwsze kamienie milowe w projekcie RDA. W: Dialog z bibliotekami. Tom 26, wydanie 1, 2014, s. 25–31, tutaj s. 28, ( PDF; 310 kB ).
  2. GND: Lista kodowań w podpolu $4 - alfabetycznie według kodu ( pamiątka z 23 września 2015 r. w Internet Archive ).
  3. Skrót „Tn” oznacza nazwę tezaurusa i oznacza niezindywidualizowane zestawy danych nazw. Oznaczony jako „niezróżnicowany” w VIAF .
  4. „Zniesienie danych organów Tn w GND ze skutkiem na dane tytułowe DNB” , 28 maja 2020 r. Data dostępu: 14 lipca 2020 r.
  5. Wytyczne dotyczące alokacji kodowania jednostek GND ( pamiątka z 23 września 2015 r. w Internet Archive ) (stan na 21 czerwca 2013 r.).
  6. „Kodowanie podmiotów — wytyczne dotyczące przyznawania nagród” (stan na 15 listopada 2018 r.)
  7. ^ „Lista specjalistycznych prac referencyjnych dla Common Authority File (GND)” ( DNB 1037142683 ).
  8. https://data.dnb.de/opendata/
  9. Niemiecka Biblioteka Narodowa – Raport Roczny 2015 , s. 49. Pobrane 3 czerwca 2016.
  10. Niemiecka Biblioteka Narodowa – Raport Roczny 2016 , s. 51. Pobrane 13 kwietnia 2019 r.
  11. Niemiecka Biblioteka Narodowa – Raport Roczny 2017 , s. 51. Pobrane 13 kwietnia 2019 r.
  12. Niemiecka Biblioteka Narodowa – Raport Roczny 2018 , s. 49. Pobrane 27 stycznia 2020.
  13. Niemiecka Biblioteka Narodowa – Raport Roczny 2019 , s. 49. Pobrane 24 czerwca 2020.
  14. data.dnb.de , stan na 13 lutego 2020 r. Data dostępu: 2 lipca 2020 r.
  15. data.dnb.de , stan na: 22 czerwca 2020 r. Data dostępu: 15 lipca 2020 r.
  16. data.dnb.de , od 13 października 2020 r. 12:20 czasu UTC. Data dostępu: 20 lutego 2021 r.
  17. Niemiecka Biblioteka Narodowa – Raport Roczny 2020 , s. 49. Pobrane 3 lipca 2021.
  18. data.dnb.de , stan na 13 lutego 2021 13:20 UTC. Data dostępu: 5 marca 2021 r.
  19. data.dnb.de , stan: 13 czerwca 2021 12:20 UTC. Data dostępu: 3 lipca 2021 r.
  20. data.dnb.de , od 13 października 2021 12:20 UTC. Opublikowano 2021-11-23 12:57-13:08. Data dostępu: 3 grudnia 2021 r.
  21. https://data.dnb.de/opendata/
  22. IN2N ( pamiątka z 12 sierpnia 2015 w Internet Archive ), Deutsches Filminstitut , Data zapytania: 21 listopada 2013.
  23. Alexander Haffner: Międzyinstytucjonalna integracja danych organów (IN2N). W: Dialog z bibliotekami. Tom 25, wydanie 2, 2013, s. 42–45, ( PDF; 54 kB ).