internetarchieven | |
---|---|
"Universele toegang tot alle kennis" | |
Webarchivering / Digitale bibliotheek | |
Talen | Engels |
Stoel | San Francisco , Californië , Verenigde Staten![]() |
oprichter | Brewster Bald |
operator | internetarchieven |
redactie | Brewster Bald |
Registratie | optioneel |
Online | 1996 |
https://archive.org/ |
Het internetarchief in San Francisco is een non-profitproject opgericht door Brewster Kahle in 1996 en heeft sinds 2007 de officiële bibliotheekstatus. Het is begonnen als een puur webarchief , waar je gearchiveerde websites kunt bekijken met behulp van de zogenaamde Wayback Machine . Vanaf 1999 kwamen daar nog meer archieven bij, zodat het nu een digitale bibliotheek is met belangrijke verzamelingen teksten en boeken, audiobestanden, video's, afbeeldingen en software. Het internetarchief heeft langetermijnarchiveringdigitale gegevens in een vrij toegankelijke vorm en hecht groot belang aan toegangsmogelijkheden voor blinde of anderszins beperkte gebruikers.
Naast zijn functie als archief ziet het Internetarchief zichzelf ook als activist voor een open en vrij internet en het bewaren en verspreiden van werken in het publieke domein . [1]
Brewster Kahle richtte in mei 1996 het Internet Archive op als een 501 ( c)(3) non- profitorganisatie . Het kreeg vanaf het begin een grote datalevering van Alexa Internet . Als onderdeel van webarchivering slaat het zogenaamde herinneringen op , i. H. Snapshots van websites en Usenet- bijdragen. [2]
Vanaf 1999 werd het doel uitgebreid met een uitgebreide, vrij toegankelijke bibliotheek door de opname van het Prelinger Archief en later andere collecties. Het internetarchief omvat begin 2021 een collectie van ruim 28 miljoen boeken en teksten, zes miljoen video's en films, 14 miljoen audiobestanden, 580.000 computerprogramma's en 3,5 miljoen beeldbestanden. Het webarchief van Wayback Machine bevat nu meer dan 475 miljard webpagina's. [2]
Voor 2014 meldde het project dat gegevens waren opgeslagen op 20.000 harde schijven in vier datacenters . Een mirrorserver van de gegevens uit San Francisco staat onder meer in de Egyptische Bibliotheca Alexandrina . Begin 2021 bereikte de collectie een omvang van meer dan 45 petabyte . [3]
Het archief is sinds mei 2007 officieel erkend als bibliotheek door de Amerikaanse staat Californië . [4]
Sinds de verkiezingen van 8 november 2016 is het Internet Archive van plan om een permanent bijgewerkte kopie in Canada te deponeren , aldus zijn website . [5]
Het audioarchief bevat sinds 2017 ruim drie miljoen geluidsopnames . Deze variëren van radioshows en radio -uitzendingen tot audioboeken , poëzievoordrachten , live concertopnames en muziek die door gebruikers is geüpload. Het archief kan ook worden gebruikt om podcasts te publiceren . [6]
In het beeldarchief zijn al meer dan 1¼ miljoen beeldbestanden beschikbaar. Dit zijn afbeeldingen van kunstwerken , zoals een verzameling afbeeldingen uit het Metropolitan Museum of Art met meer dan 100.000 inzendingen, afbeeldingen van historische kaarten, astronomische afbeeldingen van NASA , platenhoezen en ook vrij beschikbare afbeeldingen van particulieren .
De Library of Congress heeft in december 2006 zes uitzonderingen toegestaan op de Digital Millennium Copyright Act . [7] Het internetarchief kan dus computersoftware of games opslaan die desertware zijn geworden [ 8] met de bedoeling ze te behouden wanneer de originele hardware, formaten of technologie verouderd zijn. In 2013 begon het internetarchief met het aanbieden van klassieke games als speelbare webbrowserstreaming via MESS- emulatie [9] , b.v. B. de Atari 2600 -videogame ET the Extra-Terrestrial. [10] Vanaf 23 december 2014 zullen duizenden klassieke DOS- computerspellen in de browser worden gepresenteerd voor onderwijs- en onderzoeksdoeleinden [11] met behulp van DOSBox- emulatie. [12] [13] [14] [15]
The Million Book Project digitaliseert en maakt beschikbaar om te downloaden , via het internetarchief, boeken die het publieke domein zijn binnengekomen door het verstrijken van het auteursrecht (Amerikaanse auteursrechtwet ) of om andere redenen . De digitale exemplaren zijn onderdeel van de Open Bibliotheek . Inmiddels zijn er meer dan tien miljoen boeken en teksten gearchiveerd.
Verschillende scancentra (twaalf in totaal in 2009) worden onderhouden, bijvoorbeeld in Richmond . Scannen is per bestelling, tien dollarcent wordt per pagina in rekening gebracht (vanaf 2009). De klanten, meestal bibliotheken, ontvangen de digitale kopie , een tekstbestand gegenereerd door OCR , een permanent internetadres en de mogelijkheid om de digitale kopie op de servers van de vereniging op te slaan. [16] Ook zijn er samenwerkingsovereenkomsten met zelfdigitaliserende bibliotheken voor losse diensten zoals OCR en redundante hosting.
Om de geloofwaardigheid van citaten uit boeken in Wikipedia waarnaar wordt verwezen te verbeteren , is er sinds 2019 een samenwerking tussen Wikipedia en het internetarchief . Er is een begin gemaakt met het toevoegen van digitale scans van de geciteerde boeken aan de verwijzingen in Wikipedia-artikelen. [17] De betreffende passage wordt elk op twee pagina's gepresenteerd. Een voorbeeld hiervan is citaat nummer 163 [18] (vanaf 26 april 2022) in het Engelstalige artikel over Martin Luther King .
In september 2020 presenteerde het Internet Archive een initiatief voor het archiveren en open access beschikbaar stellen van publicaties onder de naam "Internet Archive Scholar" [19] .
Onder de rubriek "Films" biedt het internetarchief meer dan 85.000 films (vanaf februari 2022), waaronder tal van oude klassiekers. Ook trailers en korte films maken deel uit van het aanbod, evenals diverse propagandafilms uit de tijd van de Tweede Wereldoorlog . [20]
Onder de meer dan 3.500 stomme films zijn 437 films in de categorie "Silent Hall of Fame" met vroege werken van Charlie Chaplin of Buster Keaton , maar ook van Duitse regisseurs als Robert Wiene (onder meer vertegenwoordigd door Das Cabinet des Dr. Caligari uit 1920) anderen). Het speelfilmaanbod wordt aangevuld met vroege documentaires, b.v. B. toont de aankomst van Europese immigranten in 1909 op Ellis Island (door Billy Bitzer ). [21] De bekende genreklassiekers van Georges Méliès zijn natuurlijk vertegenwoordigd in de apart vermelde collectie , zoals de 16 minuten durende stomme film Journey to the Moonuit 1902. [22]
Naast experimentele films van bekende regisseurs als Ingmar Bergman (o.a. Persona , 1966), zijn er ook klassiekers van grootmeester Alfred Hitchcock . is vertegenwoordigd met In the Shadow of Doubt (1946). De Spanjaard Segundo de Chomón heeft ook zijn eigen rubriek, net als de Duitse experimentele filmmaker Lutz Mommartz en de Oostenrijker Johann Schwarzer . Er worden verschillende genres geserveerd, er is zowel historisch als een sectie met bijna 300 filmkomedies [23] en meer dan 450 sciencefiction- en horrorfilms, zoals B. Nosferatu - Een symfonie van horror door Friedrich Wilhelm Murnau (1922). [24] Naast zeldzame grindhouse- en exploitatiefilms [25] zoals Sex Madness (1938) of Begotten ( E. Elias Merhige , 1989) en cyberpunkwerken zoals Tetsuo: The Iron Man van de Japanse Shin'ya Tsukamoto .
De film noir is vertegenwoordigd met 700 on-demand items, waaronder Temptation Street van Fritz Lang (1946) en The Third Man van Carol Reed (1949). [26]
Er zijn ook meer dan 7.000 films en video's met sportthema [27] , animatiefilms en korte films [28] , evenals meer dan 16.000 inhoud met een kunst- en muziekthema [29] en meer dan 100.000 visuele artikelen over religie en spiritualiteit . [30]
In 2013 begon het internetarchief met het aanbieden van klassieke games als speelbare webbrowserstreaming via MESS- emulatie . [9]
De Wayback Machine (“Take Me Back”) is een online service waarmee u verschillende versies van opgeslagen webpagina's kunt ophalen. De pagina's die moeten worden opgeslagen, worden geselecteerd via de Alexa-internetservice . Alle daar opgeslagen URL's worden regelmatig opgeroepen en gearchiveerd. U kunt een niet-opgeslagen internetbron ook handmatig opnemen door naar de pagina te zoeken en vervolgens de opname te bevestigen (bestandsinhoud, bijv. JPG - afbeeldingen, wordt opgeslagen zonder voorafgaande prompt). Het totale volume bedroeg in november 2009 ongeveer 150 miljard pagina's en groeide in maart 2020 tot meer dan 625 miljard pagina's.
Een andere webarchiefdienst voor individuele webarchivering werd in 2006 beschikbaar gesteld met Archive-It . Instellingen en particulieren hebben de mogelijkheid om digitale back-ups van hun collecties te maken en zelf de vrijgave van de gegevens te bepalen. Archive-It heeft meer dan 400 partners uit 16 landen over de hele wereld, voornamelijk bestaande uit universiteiten, staatsarchieven, musea en kunstbibliotheken, openbare bibliotheken en andere openbare instellingen en NGO's . Archive-It biedt deelnemende partners een full- text search op hun content, maar ook de mogelijkheid om metadata verrijkte gestructureerde datasets voor onderzoekers te exporteren. [31]
De opname van het Prelinger-archief [32] in 1999 was de eerste uitbreiding van het internetarchief die verder ging dan webarchivering. Tegenwoordig bevat het ruim drie miljoen video's en films die onder een vrije licentie of in het publieke domein vallen. Ook wordt hier gewerkt aan een archief voor televisieprogramma 's .
Het Internetarchief wordt gefinancierd door donaties en subsidies van verschillende stichtingen, instituten en verenigingen op het gebied van onderwijs, onderzoek, wetenschap, etc. In april 2019 heeft het Internetarchief de volgende donateurs aangewezen: Andrew W. Mellon Foundation , Council on Library en Informatiebronnen , Democratiefonds van de Verenigde Naties Federal Communications Commission Universal Service Program for Schools and Libraries (E-Rate) Institute of Museum and Library Services (IMLS) Knight Foundation Laura en John Arnold Foundation National Endowment for the Humanities ( Office of Digital Humanities), National Science Foundation , Peter en Carmen Lucia Buck Foundation , Philadelphia Foundation , Rita Allen Foundation . [2]
Coördinaten: 37° 46′ 56.3″ N , 122° 28′ 17.6″ W