Arquivo de Autoridade Comum | |
---|---|
| |
fundador | 2012 |
Duração | 8.920.450 |
localização | Frankfurt am Main |
Estado Islâmico | EN-588 |
operador | Biblioteca Nacional Alemã e outros |
local | https://gnd.network |
O Arquivo de Autoridade Comum ( GND ) é um arquivo de autoridade para pessoas , corporações , congressos , geografias , cabeçalhos de assunto e títulos de trabalho , que é usado principalmente para catalogar literatura em bibliotecas, mas também está sendo cada vez mais usado por arquivos, museus, projetos e em aplicações web . É administrado pela Biblioteca Nacional Alemã (DNB), todas as associações de bibliotecas de língua alemã , o banco de dados de periódicos(ZDB) e inúmeras outras instituições. Os dados de autoridade facilitam a catalogação, oferecem acesso de pesquisa claro e a possibilidade de vincular diferentes recursos de informação.
Em 19 de abril de 2012, o GND substituiu os arquivos de autoridade anteriormente separados Personal Name File (PND), Common Corporate Body File (GKD), Keyword Authority File (SWD) e o arquivo de título de assunto uniforme do German Music Archive (DMA-EST Arquivo). Desde julho de 2014, os dados de autoridade são registrados de acordo com as regras da RDA , que também são utilizadas pela Biblioteca do Congresso , entre outras . [1]
O arquivo de autoridade conjunta foi desenvolvido de 2009 a 2012 em um projeto conjunto da Biblioteca Nacional da Alemanha, das redes de bibliotecas de língua alemã e do banco de dados de periódicos. O objetivo do projeto era mesclar os arquivos de autoridade GKD, PND e SWD anteriormente gerenciados separadamente e o arquivo DMA-EST. Um formato de dados comum deve ser implementado e as diferenças existentes nos regulamentos devem ser harmonizadas.
A criação de registros de autoridade costumava ser baseada em diferentes conjuntos de regras. Estas foram as “ Regras para Catalogação Alfabética ” (RAK-WB e RAK-Musik) para indexação formal e as “ Regras para Catalogação por Palavras-Chave ” (RSWK) para indexação do conteúdo. As regras inconsistentes para a criação da designação preferencial para a indexação formal e de conteúdo levaram a conjuntos de dados redundantes no GKD e no SWD, especialmente na área de órgãos sociais, congressos e materiais geográficos. Assim, foram desenvolvidas regras transitórias para o GND para os casos em que as regras de indexação formal e de conteúdo divergem umas das outras, o que possibilita o uso conjunto dos registros de dados de autoridade. As regras transitórias já levam em consideração , na medida do possível , os regulamentos da RDA ( Resource Description and Access ) .
Os formatos de dados dos arquivos de autoridade, tanto os formatos internos quanto os formatos de intercâmbio, também diferiram consideravelmente em alguns casos. O formato de troca GND é baseado na Autoridade MARC 21 . Ao mesclar todos os registros de dados de autoridade no GND, as diferenças de formato anteriormente existentes podem ser superadas. No entanto, os conjuntos de dados paralelos existentes dos diferentes arquivos de autoridade só podem ser mesclados ao longo do tempo.
No projeto Virtual International Authority File (VIAF), o GND é virtualmente combinado com outros arquivos de autoridade para formar um arquivo de autoridade internacional.
Os dados consistem em entidades e declarações sobre eles. Cada entidade tem um tipo de entidade e pelo menos um identificador.
Cada registro descreve uma entidade.
Os tipos de entidade listados aqui correspondem aos chamados tipos de registro ( tipo de registro de dados ) nas bibliotecas .
No arquivo de autoridade comum, um número de identificação único (IDN ou PPN; base para o Identificador Uniforme de Recursos no sistema de produção), um termo preferencial padronizado (anteriormente também: forma autorizada ), diferentes formas de nomes (sinônimos) e vários atributos descritivos são registrados para cada descrição de entidade . Se possível, os atributos são armazenados como relacionamentos com outros registros de dados de autoridade, com o tipo de relacionamento sendo codificado em cada caso. [2]Exemplos de atributos relacionados são locais de nascimento e morte de pessoas e suas ocupações. Para empresas, por ex. Relacionamentos de predecessores e sucessores, mas também superordenados administrativos são especificados. No caso de termos de assunto, os termos genéricos e os termos relacionados são vinculados. Isso significa que a literatura sobre tópicos relacionados também pode ser encontrada ao pesquisar em um catálogo de biblioteca. Um processamento semântico e temático rico e preciso (dependendo do assunto também: orientado dogmaticamente ) das entradas GND entre si beneficia a qualidade da recuperação .
Desta forma, cria-se uma rede semântica de conjuntos de dados relacionados ( dados vinculados ), que é particularmente adequado para uso na web, permite a navegação dentro do arquivo de autoridade e, assim, melhora as opções de pesquisa para os usuários.
No final de agosto de 2019, o uso de frases Tn para nomes pessoais foi descontinuado. [3] Um ano depois, em 19 de junho de 2020, os links entre os registros Tn nos dados bibliográficos foram excluídos retrospectivamente. A razão para isso foi a qualidade predominantemente ruim das sentenças Tn. Muitos estavam apenas em um nível muito baixo de catalogação. Muitas vezes, não estava claro a qual pessoa um conjunto de dados poderia ser atribuído, portanto, os dados não eram desambiguados. Havia duplicatas e links incorretos para dados bibliográficos. Em vez de links, agora há apenas strings de texto nos dados bibliográficos. Desde julho de 2020, os registros de nomes não fazem mais parte do arquivo de autoridade comum. [4]
Além de nomes pessoais, cada tipo de registro pode ser diferenciado especificando um código de entidade [5] . Por exemplo, uma entidade geográfica pode ser um estado ou um edifício. Um total de seis tipos de entidades estão disponíveis, que são divididos em cerca de 50 subtipos.
código | definição [6] |
---|---|
G | geografia |
dar | Edifícios e conjuntos de edifícios, esculturas monumentais, monumentos, túmulos, etc. de acordo com RSWK §730.1 |
gif; gik | Estados membros (são sempre codificados duplamente com "gik") |
gik | autoridades locais e unidades administrativas |
gil; gik | Países, estados (independentes) (são sempre codificados duplamente com "gik") |
Gin | Unidades geográficas naturais, unidades biogeográficas e paleográficas, nomes de subunidades geográficas com pontos cardeais ou com outras expressões de acordo com RSWK § 205, 1 e 2 |
gio | Geografia de pequena escala dentro de um local, com exceção de edifícios e conjuntos de edifícios |
menina; gik | Principados imperiais espirituais (até 1803), unidades administrativas da Igreja Oriental (são sempre duplamente codificados com "gik") |
dar; gik | Unidades administrativas que, de acordo com EH-G-03, recebem um termo genérico instantâneo do termo genérico da unidade administrativa (são sempre duplamente codificados com "gik") |
dar | Fronteiras, caminhos, linhas |
gix | estranho |
giz | Todos os nomes geográficos que não podem ser atribuídos a nenhum dos outros subtipos, regiões e áreas de entidades de acordo com RSWK § 204a, incluindo os arredores de cidades e municípios individuais |
gxz | Lugares fictícios |
k | corporações |
kif | Empresas (a partir de janeiro de 2016) |
Kim | Corpos musicais (em janeiro de 2016) |
kio | órgãos das autarquias locais |
pular | Projetos e planos e programas semelhantes a projetos |
kiv; kir | Unidades administrativas religiosas (por exemplo, dioceses da Igreja Católica; exceção: unidades administrativas da Igreja Oriental, unidades administrativas da Igreja Oriental são codificadas com "gir" e "gik") (elas são sempre codificadas duas vezes com "kir") (a partir de janeiro de 2016 ) |
kiz | Todos os outros órgãos sociais que não pertencem a nenhum outro tipo de entidade especial |
kxz | Entidades fictícias |
p | pessoas |
pif | Famílias |
pique | Príncipes reinantes, membros de casas principescas governantes |
pip | pseudônimos |
xixi | pseudônimos coletivos |
pizza | Nomes pessoais que não pertencem a nenhum outro tipo de entidade especial |
pxg | Deuses |
pxl | Figuras literárias, figuras lendárias |
px | fantasmas |
s | termos técnicos |
sab; soz | Instrumentação musical (de acordo com RDA 6.15) (sempre são codificados duplamente com "saz") (a partir de janeiro de 2016) |
triste; soz | Portadores de dados (de acordo com RDA 3.4.1.3 DA-CH) (sempre são codificados duplamente com "saz") |
seguro; soz | Informações do formulário sobre o tipo de conteúdo (de acordo com RDA 7.2.1.3 DA-CH) (são sempre codificados duplamente com "saz") |
dizer; soz | Gênero musical (de acordo com RDA 6.14.2.5.2 DA-CH) (eles são sempre codificados duplamente com "saz") (a partir de janeiro de 2016) |
sim; soz | Forma de saída musical (de acordo com RDA 7.20.1.3 DA-CH) (são sempre duplamente codificados com "saz") |
soz | termos gerais, i. H. todos os cabeçalhos de assunto que não pertencem a nenhum outro tipo de entidade especial |
vocês | etnográfico |
sif | Meio de transporte com nomes individuais |
Vejo | Eventos individuais históricos |
trago | Produtos e nomes de marcas que não sejam produtos de software (“siw”) |
irmã | línguas |
Ei | Grupos de pessoas que não são pessoas colectivas |
sw | produtos de software |
Tamanho | Todos os fatos individuais que são registrados como termos de assunto e não podem ser atribuídos a nenhum dos outros subtipos de entidade, por exemplo, B. Competições |
slz | Letras, morfemas, palavras como objetos de investigação linguística. |
snz | Nomenclatura Biologia - Química |
sxz | Termos fictícios |
szz | Todos os casos de dúvida para todas as entidades |
e | |
uiz | Não-corporações (somente em dados legados) |
v | conferências e eventos |
competir | conferências, eventos |
vif | Sequências ou séries de conferências, sequências de eventos ou séries w |
W | fábricas |
novamente | marcas de impressora |
Como as | expressão |
esposa | Versão de uma obra de música (descontinuada em julho de 2014) |
wim | obras de música |
ganhar | coleções |
limpar | características de proveniência |
conhecer | monumentos escritos |
sagacidade | fábricas |
Cada entidade pode ser claramente identificada por pelo menos um identificador (GND-ID). Cada identificador consiste nos caracteres de 0 a 9, X e um hífen. Um identificador para uma entidade do tipo de entidade p consiste em 9 ou 10 caracteres, sempre começa com 1 seguido de 8 ou 9 dígitos e termina com um caractere de verificação 0-9 ou X.
Cada registro está associado a um nível de catalogação entre 1 e 6. Quanto menor o número, maior o nível da entrada GND e melhor processado é o conjunto de dados. O padrão ao criar um novo registro de dados pessoais é inicialmente o nível 3 (Tp3).
A designação preferencial é sempre baseada nas obras listadas na " Lista de obras de referência técnica para o Arquivo de Autoridade Comum ". [7] A nomenclatura preferida de termos de assunto no GND segue o uso geral, pois é usado em enciclopédias ( Brockhaus , Meyer , alternativamente também Wikipedia) é detectável; excepcionalmente, são usados termos do jargão técnico. Sinônimos podem ser incluídos nas entradas como variantes ou os chamados quase-sinônimos. Enquanto não houver títulos suficientes para um tópico, primeiro é feita uma tentativa de expressar novos fatos combinando vários termos de assunto já disponíveis em uma sequência de palavras-chave para evitar novas entradas na medida do possível (o chamado controle de decomposição). Isso mantém a continuidade com a palavra-chave de um tópico na literatura mais antiga, para que uma referência a títulos mais antigos possa ser estabelecida. Somente quando a literatura sobre um tópico atingiu um certo grau é que um novo termo técnico é introduzido. Se o uso do idioma mudar, o termo preferido pode ser ajustado.
As quantidades podem ser encontradas nos relatórios anuais do DNB e nos trechos de dados do GND [8] .
O arquivo de autoridade comum contém cerca de 8,9 milhões de registros (em 13 de junho de 2021) dos seguintes tipos de entidade :
tipo de entidade / data | fonte | pessoas (individualizado) |
Nomes pessoais (não individualizados) |
Pessoas e nomes pessoais (total) |
corporações | conferências e eventos |
geografia | termos técnicos | fábricas | total |
---|---|---|---|---|---|---|---|---|---|---|
código de entidade | -- | p | n | -- | k | v | G | s | W | -- |
Junho de 2013 | ? | 2.882.000 | 4.628.000 | (7.510.000) | 1.172.000 | 587.000 | 293.000 | 202.000 | 193.000 | (9.957.000) |
2015 | Relatório Anual [9] | nenhuma informação | nenhuma informação | 8.669.790 | 1.240.852 | 619.610 | 289.449 | 205.586 | 244.480 | 11.269.767 |
2016 | Relatório Anual [10] | nenhuma informação | nenhuma informação | 10.546.959 | 1.498.606 | 769.067 | 295.027 | 207.149 | 287.204 | 13.604.012 |
2017 | Relatório Anual [11] | nenhuma informação | nenhuma informação | 11.551.274 | 1.493.823 | 786.180 | 300.138 | 209.003 | 331.310 | 14.671.728 |
2018 | Relatório Anual [12] | nenhuma informação | nenhuma informação | 12.032.087 | 1.487.938 | 803.612 | 305.543 | 211.339 | 367.574 | 15.208.093 |
2019 | Relatório Anual [13] | nenhuma informação | nenhuma informação | 12.265.826 | 1.490.830 | 826.579 | 310.860 | 212.775 | 405.899 | 15.512.769 |
fevereiro de 2020 | SUD [14] | 5.251.171 | 7.046.133 | 12.297.304 | 1.491.072 | 829.548 | 311.357 | 212.895 | 410.736 | 15.552.912 |
Junho de 2020 | SUD [15] | 5.350.953 | desistiu | (5.350.953) | 1.491.358 | 836.410 | 313.058 | 213.257 | 425.718 | 8.630.754 |
13 de outubro de 2020 | SUD [16] | 5.421.947 | desistiu | (5.421.947) | 1.490.757 | 842.725 | 314.492 | 213.528 | 442.181 | 8.725.630 |
2020 | Relatório Anual [17] | 5.467.413 | nenhuma informação | nenhuma informação | 1.493.057 | 846.449 | 315.389 | 213.655 | 451.414 | 8.787.377 |
13 de fevereiro de 2021 | SUD [18] | 5.496.766 | desistiu | (5.496.766) | 1.495.527 | 848.846 | 315.924 | 213.779 | 456.893 | 8.827.735 |
13 de junho de 2021 | SUD [19] | 5.574.687 | desistiu | (5.574.687) | 1.501.942 | 854.637 | 317.093 | 203.371 | 468.720 | 8.920.450 |
23 de outubro de 2021 | SUD [20] | 5.650.830 | desistiu | (5.650.830) | 1.507.546 | 854.539 | 318.392 | 203.801 | 479.558 | 9.014.666 |
Em 13 de junho de 2021, existem 465.790 registros de deflexão publicados no formato RDF (JSON-LD) em open.dnb.de/opendata. Isso significa que alguns registros de dados podem ser referenciados por meio de vários identificadores GND.
encontro | número | anotação |
---|---|---|
13/04/2021 | 461.335 | |
13/06/2021 | 465.790 | |
13/11/2021 | 472.485 | GND, conjuntos de deflexão sem Tu |
Em 13 de junho de 2021, 13h20 UTC, os arquivos "authorities_lds" continham 163.131.042 triplos em 8.920.450 registros. [21]
Tempo | registros | triplo |
---|---|---|
13/06/2021 13:20 UTC | 8.920.450 | 163.131.042 |
13/10/2021 12:20 UTC | 9.014.666 | 165.639.860 |
O arquivo da autoridade conjunta é mantido na Biblioteca Nacional da Alemanha. As redes de bibliotecas importaram o estoque básico GND em seus sistemas de rede uma vez e, desde então, obtiveram as atualizações do arquivo de autoridade por meio do processo OAI . O GND não é apenas editado e ampliado por bibliotecas, mas também por arquivos (até agora principalmente por arquivos científicos e literários), museus e editores de obras de referência. A colaboração ocorre por meio de associações de bibliotecas ou após consulta à Biblioteca Nacional Alemã. A utilização pelos arquivos estaduais e municipais está apenas começando (a partir de 2015).
Os dados de autoridade GND estão disponíveis gratuitamente no site do DNB nos formatos MARC 21 Authority, MARC21-xml e RDFxml sob licença CC0 1.0 .
Em dezembro de 2012, foi iniciado um projeto de cooperação entre a Biblioteca Nacional da Alemanha (DNB) e o Instituto Alemão de Cinema (DIF) sob o nome de Integração Institucional de Dados Normais (IN2N). O objetivo do projeto, financiado pela Fundação Alemã de Pesquisa (DFG), é apoiar instituições não bibliotecárias no uso do GND e envolvê-las na indexação. [22] Entre outras coisas, como parte do projeto, os conjuntos de dados do filmportal.de foram comparados com os artigos pessoais da Wikipedia . [23]
No final de 2014, os dados padrão do DIF foram importados para o GND. Nos meses anteriores, dados do Instituto Ibero-Americano (Berlim) e do Centro de Pesquisas do Leste Europeu da Universidade de Bremen, entre outros, já haviam sido transferidos para o GND. Desde 6 de maio de 2016, os wikipedistas que participaram do treinamento apropriado podem criar dados de autoridade para indivíduos usando o “formulário web GND”. O identificador de biblioteca correspondente é Wikimedia Germany (DE-B1592).