Общий авторитетный файл | |
---|---|
| |
основание | 2012 |
Продолжительность | 8 920 450 |
расположение | Франкфурт-на-Майне |
ИГИЛ | EN-588 |
оператор | Немецкая национальная библиотека и другие |
сайт | https://gnd.network |
Общий авторитетный файл ( GND ) — это авторитетный файл для лиц , корпораций , конгрессов , географических материалов , предметных рубрик и названий работ , который в основном используется для каталогизации литературы в библиотеках, но также все чаще используется архивами, музеями, проектами и организациями. веб-приложения . Управляется Немецкой национальной библиотекой (DNB), всеми немецкоязычными библиотечными ассоциациями , базой данных журналов .(ZDB) и многие другие учреждения. Авторитетные данные облегчают каталогизацию, предлагают четкие точки доступа для поиска и возможность связывания различных информационных ресурсов.
19 апреля 2012 г. GND заменил ранее отдельные авторитетные файлы: файл личного имени (PND), общий файл юридического лица (GKD), авторитетный файл ключевых слов (SWD) и файл единого предметного заглавия Немецкого музыкального архива (DMA-EST ). файл). С июля 2014 года авторитетные данные записываются в соответствии с правилами RDA , которые также используются, в частности, Библиотекой Конгресса . [1]
Общий авторитетный файл разрабатывался с 2009 по 2012 год в рамках совместного проекта Немецкой национальной библиотеки, сетей немецкоязычных библиотек и базы данных журналов. Цель проекта заключалась в объединении ранее отдельно управляемых авторитетных файлов GKD, PND и SWD и файла DMA-EST. Следует внедрить общий формат данных и согласовать существующие различия в правилах.
Раньше создание авторитетных записей основывалось на различных наборах правил. Это были « Правила алфавитной каталогизации » (RAK-WB и RAK-Musik) для формальной индексации и « Правила каталогизации ключевых слов » (RSWK) для индексации содержания .. Несогласованные правила создания предпочтительного обозначения для формальной и содержательной индексации привели к избыточным наборам данных в ГКД и ДСО, особенно в области корпоративных органов, съездов и географических материалов. Поэтому были разработаны переходные правила для GND для случаев, когда правила формальной и содержательной индексации отклоняются друг от друга, которые позволяют совместное использование авторитетных записей данных. Переходные правила уже максимально учитывают положения RDA ( описание ресурсов и доступ ) .
Форматы данных авторитетных файлов, как внутренние форматы, так и форматы обмена, в некоторых случаях также значительно различались. Формат обмена GND основан на авторитете MARC 21 . Объединив все записи авторитетных данных в GND, можно было преодолеть существовавшие ранее различия в форматах. Однако существующие параллельные наборы данных из разных авторитетных файлов могут быть объединены только со временем.
В проекте Виртуальный международный авторитетный файл (VIAF) GND виртуально объединяется с другими авторитетными файлами для формирования международного авторитетного файла.
Данные состоят из сущностей и утверждений о них. Каждая сущность имеет тип сущности и по крайней мере один идентификатор.
Каждая запись описывает объект.
Перечисленные здесь типы сущностей соответствуют так называемым типам записей ( тип записи данных ) в библиотеках .
В общем авторитетном файле уникальный идентификационный номер (IDN или PPN; основа для унифицированного идентификатора ресурса в производственной системе), стандартизированный предпочтительный термин (ранее также: авторизованная форма ), различные формы имен (синонимы) и различные описательные атрибуты. записываются для каждого описания сущности . Если возможно, атрибуты сохраняются как отношения к другим авторитетным записям данных, при этом тип отношения кодируется в каждом случае. [2]Примерами связанных атрибутов являются места рождения и смерти людей и их занятия. Для корпораций, например. Указываются отношения предшественника и преемника, а также административные суперординаты. В случае предметных терминов родовые термины и родственные термины связаны между собой. Это означает, что литературу по смежным темам также можно найти при поиске в библиотечном каталоге. Богатая и точная семантическая и тематическая (в зависимости от предмета также: догматически ориентированная) обработка записей GND друг к другу способствует повышению качества поиска .
Таким образом создается семантическая сеть связанных наборов данных ( связанные данные ), которая особенно подходит для использования в Интернете, позволяет осуществлять навигацию по авторитетному файлу и, таким образом, улучшает возможности поиска для пользователей.
В конце августа 2019 г. было прекращено использование предложений Tn для личных имен. [3] Через год, по состоянию на 19 июня 2020 г., связи между записями Tn в библиографических данных были ретроспективно удалены. Причиной этого было преимущественно низкое качество предложений Tn. Многие из них находились на очень низком уровне каталогизации. Часто было неясно, к какому лицу может быть отнесен набор данных, поэтому данные не были устранены неоднозначно. Имелись дубликаты и некорректные ссылки на библиографические данные. Вместо ссылок в библиографических данных теперь только текстовые строки. С июля 2020 года записи имен больше не являются частью общего авторитетного файла. [4]
Помимо личных имен, каждый тип записи можно дополнительно дифференцировать , указав код сущности [5] . Например, географическим объектом может быть штат или здание. Всего доступно шесть типов сущностей, которые делятся примерно на 50 подтипов.
код | определение [6] |
---|---|
грамм | география |
дайте | Здания и строительные ансамбли, монументальные скульптуры, монументы, гробницы и т.п. согласно РСВК §730.1 |
гифка; гик | Государства-члены (они всегда имеют двойной код «gik») |
гик | органы местного самоуправления и административные единицы |
гил; гик | Страны, штаты (независимые) (они всегда имеют двойной код «гик») |
Джин | Природно-географические единицы, биогеографические и палеографические единицы, названия географических единиц со сторонами света или с другими выражениями в соответствии с RSWK § 205, 1 и 2 |
Джио | Мелкомасштабная география в пределах локации, за исключением зданий и ансамблей зданий |
девушка; гик | Духовные имперские княжества (до 1803 г.), административные единицы Восточной церкви (всегда дважды кодируются «гиком») |
давать; гик | Административные единицы, которые, согласно EH-G-03, получают мгновенный родовой термин из родового термина административной единицы (они всегда дважды кодируются с помощью «gik») |
дарить | Границы, пути, линии |
гикс | эстратеррестрика |
гиз | Все географические названия, которые не могут быть отнесены ни к одному из других подтипов объектов, регионов и областей в соответствии с RSWK § 204a, включая окрестности отдельных городов и муниципалитетов. |
gxz | Вымышленные места |
к | корпорации |
киф | Компании (с января 2016 г.) |
Ким | Музыкальные коллективы (по состоянию на январь 2016 г.) |
Кио | органы местной власти |
кип | Проекты и проектные планы и программы |
кив; кир | Религиозные административные единицы (например, епархии католической церкви; исключение: административные единицы Восточной церкви, административные единицы Восточной церкви кодируются с помощью «гир» и «гик») (они всегда дважды кодируются с помощью «кир») (по состоянию на январь 2016 г. ) |
киз | Все другие юридические лица, не принадлежащие ни к какому другому специальному типу юридических лиц |
кхз | Вымышленные сущности |
п | лица |
пиф | Семьи |
пик | Правящие князья, члены правящих княжеских домов |
точка | псевдонимы |
мочиться | коллективные псевдонимы |
пиз | Личные имена, не принадлежащие ни к какому другому специальному типу сущности |
pxg | боги |
пиксель | Литературные деятели, легендарные личности |
пикселей | призраки |
с | технические понятия |
саб; соз | Музыкальные инструменты (согласно RDA 6.15) (они всегда дважды кодируются словом «саз») (по состоянию на январь 2016 г.) |
грустный; соз | Носители данных (согласно RDA 3.4.1.3 DA-CH) (они всегда имеют двойное кодирование с помощью «saz») |
Безопасно; соз | Форма информации о типе контента (согласно RDA 7.2.1.3 DA-CH) (они всегда имеют двойное кодирование с "saz") |
сказать; соз | Музыкальный жанр (согласно RDA 6.14.2.5.2 DA-CH) (они всегда дважды закодированы с «saz») (по состоянию на январь 2016 г.) |
Сэм; соз | Форма музыкального вывода (согласно RDA 7.20.1.3 DA-CH) (они всегда дважды кодируются с помощью «saz») |
соз | общие положения, т. ЧАС. все предметные рубрики, не принадлежащие ни к какому другому специальному типу объекта |
ты | этнографический |
сиф | Транспортные средства с индивидуальными названиями |
видеть | Исторические отдельные события |
глоток | Продукты и торговые марки, кроме программных продуктов («siw») |
сестра | Языки |
Привет | Группы лиц, не являющиеся юридическими лицами |
SW | программные продукты |
размер | Все отдельные факты, которые записываются как предметные термины и не могут быть отнесены ни к одному из других подтипов сущностей, т.е. Б. Соревнования |
слз | Буквы, морфемы, слова как объекты лингвистического исследования |
снз | Номенклатура Биология – Химия |
секс | Вымышленные термины |
сзз | Все случаи сомнения для всех объектов |
а также | |
уиз | Некорпоративные (только в устаревших данных) |
в | конференции и мероприятия |
соперничать | конференции, мероприятия |
виф | Последовательности или серии конференций, последовательности или серии событий w |
ж | заводы |
опять таки | следы принтера |
как | выражение |
с | Версия музыкального произведения (прекращено с июля 2014 г.) |
вим | музыкальные произведения |
победить | коллекции |
вытирать | характеристики происхождения |
знать | письменные памятники |
остроумие | заводы |
Каждый объект может быть четко идентифицирован по крайней мере одним идентификатором (GND-ID). Каждый идентификатор состоит из символов от 0 до 9, X и дефиса. Идентификатор объекта типа p состоит из 9 или 10 символов, он всегда начинается с 1, за которым следуют 8 или 9 цифр, и заканчивается контрольным символом 0-9 или X.
Каждая запись связана с уровнем каталогизации от 1 до 6. Чем меньше число, тем выше уровень записи GND и тем лучше обрабатывается набор данных. Стандартом при создании новой записи личных данных изначально является уровень 3 (Tp3).
Предпочтительное обозначение всегда основывается на работах, перечисленных в « Списке технических справочных работ для Общего авторитетного файла ». [7] Предпочтительное наименование предметных терминов в GND соответствует общему употреблению, поскольку оно используется в энциклопедиях ( Брокгауз , Мейер , альтернативно также Википедия ).) поддается обнаружению; в исключительных случаях используются термины из технического жаргона. Синонимы могут быть включены в статьи как варианты или так называемые квазисинонимы. Пока для темы недостаточно заголовков, сначала делается попытка выразить новые факты путем объединения нескольких уже имеющихся предметных терминов в последовательность ключевых слов, чтобы по возможности избежать новых вхождений (так называемый контроль декомпозиции). Это поддерживает преемственность с ключевыми словами темы в старой литературе, так что можно установить ссылку на более старые заголовки. Только когда литература по теме достигает определенного уровня, вводится новый технический термин. Если использование языка изменится, предпочтительный термин может быть изменен.
Количества можно найти в годовых отчетах DNB и выдержках данных GND [8] .
Общий авторитетный файл содержит около 8,9 миллиона записей (по состоянию на 13 июня 2021 г.) следующих типов сущностей :
тип объекта/дата | источник | люди (индивидуально) |
Личные имена (не индивидуализированные) |
Лица и личные имена (всего) |
корпорации | конференции и мероприятия |
география | технические понятия | заводы | общий |
---|---|---|---|---|---|---|---|---|---|---|
код объекта | -- | п | н | -- | к | в | грамм | с | ж | -- |
июнь 2013 | ? | 2 882 000 | 4 628 000 | (7 510 000) | 1 172 000 | 587 000 | 293000 | 202 000 | 193000 | (9 957 000) |
2015 | Годовой отчет [9] | не указан | не указан | 8 669 790 | 1 240 852 | 619 610 | 289 449 | 205 586 | 244 480 | 11 269 767 |
2016 | Годовой отчет [10] | не указан | не указан | 10 546 959 | 1 498 606 | 769 067 | 295 027 | 207 149 | 287 204 | 13.604.012 |
2017 | Годовой отчет [11] | не указан | не указан | 11 551 274 | 1 493 823 | 786 180 | 300 138 | 209.003 | 331 310 | 14 671 728 |
2018 | Годовой отчет [12] | не указан | не указан | 12.032.087 | 1 487 938 | 803 612 | 305 543 | 211 339 | 367 574 | 15.208.093 |
2019 | Годовой отчет [13] | не указан | не указан | 12 265 826 | 1 490 830 | 826 579 | 310 860 | 212 775 | 405 899 | 15 512 769 |
февраль 2020 г. | ЛДС [14] | 5 251 171 | 7 046 133 | 12 297 304 | 1 491 072 | 829 548 | 311 357 | 212 895 | 410 736 | 15 552 912 |
июнь 2020 г. | ЛДС [15] | 5 350 953 | бросил | (5 350 953) | 1 491 358 | 836 410 | 313 058 | 213 257 | 425 718 | 8 630 754 |
13 окт 2020 | ЛДС [16] | 5 421 947 | бросил | (5 421 947) | 1 490 757 | 842 725 | 314 492 | 213 528 | 442.181 | 8 725 630 |
2020 | Годовой отчет [17] | 5 467 413 | не указан | не указан | 1 493 057 | 846 449 | 315 389 | 213 655 | 451 414 | 8 787 377 |
13 фев. 2021 г. | ЛДС [18] | 5 496 766 | бросил | (5 496 766) | 1 495 527 | 848 846 | 315 924 | 213 779 | 456 893 | 8 827 735 |
13 июня 2021 г. | ЛДС [19] | 5 574 687 | бросил | (5 574 687) | 1 501 942 | 854 637 | 317 093 | 203 371 | 468 720 | 8 920 450 |
23 окт. 2021 г. | ЛДС [20] | 5 650 830 | бросил | (5 650 830) | 1 507 546 | 854 539 | 318 392 | 203.801 | 479 558 | 9 014 666 |
По состоянию на 13 июня 2021 г. на сайте open.dnb.de/opendata в формате RDF (JSON-LD) опубликовано 465 790 записей об отклонениях. Это означает, что на некоторые записи данных можно ссылаться через несколько идентификаторов GND.
свидание | количество | аннотация |
---|---|---|
13.04.2021 | 461 335 | |
13.06.2021 | 465 790 | |
13.11.2021 | 472 485 | GND, отклоняющие комплекты без Tu |
По состоянию на 13 июня 2021 г., 13:20 UTC, файлы «authorities_lds» содержат 163 131 042 триплета в 8 920 450 записях. [21]
время | записи | тройной |
---|---|---|
13.06.2021 13:20 МСК | 8 920 450 | 163.131.042 |
2021-10-13 12:20 UTC | 9 014 666 | 165 639 860 |
Совместное досье хранится в Немецкой национальной библиотеке. Сети библиотек один раз импортировали базовый фонд GND в свои сетевые системы и с тех пор получают обновления авторитетного файла через процесс OAI . ГНД редактируется и пополняется не только библиотеками, но и архивами (пока прежде всего научными и литературными), музеями и редакторами справочников. Сотрудничество осуществляется либо через библиотечные ассоциации, либо после консультаций с Немецкой национальной библиотекой. Использование государственными и муниципальными архивами только начинается (по состоянию на 2015 г.).
Данные авторитета GND доступны бесплатно на веб-сайте DNB в форматах MARC 21 Authority, MARC21-xml и RDFxml по лицензии CC0 1.0 .
В декабре 2012 года был начат проект сотрудничества между Немецкой национальной библиотекой (DNB) и Немецким институтом кино (DIF) под названием «Межведомственная интеграция данных о нормах» (IN2N). Цель проекта, финансируемого Немецким исследовательским фондом (DFG), состоит в том, чтобы поддержать небиблиотечные учреждения в использовании GND и привлечь их к индексации. [22] Среди прочего, в рамках проекта наборы данных с filmportal.de сравнивались с личными статьями из Википедии . [23]
В конце 2014 года стандартные данные из DIF были импортированы в GND. За несколько месяцев до этого в GND уже были переданы данные Иберо-американского института (Берлин) и Исследовательского центра Восточной Европы при Бременском университете. С 6 мая 2016 года википедисты, прошедшие соответствующее обучение, могут создавать авторитетные данные для отдельных лиц с помощью «веб-формы GND». Соответствующий идентификатор библиотеки — Wikimedia Germany (DE-B1592).