Nederlands

Internetarchieven

Internetarchieven

Van Wikipedia, de gratis encyclopedie
Spring naar navigatie Spring naar zoeken

Het internetarchief in San Francisco is een non-profitproject opgericht door Brewster Kahle in 1996 en heeft sinds 2007 de officiële bibliotheekstatus. Het is begonnen als een puur webarchief , waar je gearchiveerde websites kunt bekijken met behulp van de zogenaamde Wayback Machine . Vanaf 1999 kwamen daar nog meer archieven bij, zodat het nu een digitale bibliotheek is met belangrijke verzamelingen teksten en boeken, audiobestanden, video's, afbeeldingen en software. Het internetarchief heeft langetermijnarchiveringdigitale gegevens in een vrij toegankelijke vorm en hecht groot belang aan toegangsmogelijkheden voor blinde of anderszins beperkte gebruikers.

Naast zijn functie als archief ziet het Internetarchief zichzelf ook als activist voor een open en vrij internet en het bewaren en verspreiden van werken in het publieke domein . [1]

oorsprong en geschiedenis

Brewster Kahle , oprichter van Alexa Internet en het internetarchief (2015)
Spiegelserver met de gegevens uit San Francisco in de Egyptische Bibliotheca Alexandrina

Brewster Kahle richtte in mei 1996 het Internet Archive op als een 501 ( c)(3) non- profitorganisatie . Het kreeg vanaf het begin een grote datalevering van Alexa Internet . Als onderdeel van webarchivering slaat het zogenaamde herinneringen op , i. H. Snapshots van websites en Usenet- bijdragen. [2]

Vanaf 1999 werd het doel uitgebreid met een uitgebreide, vrij toegankelijke bibliotheek door de opname van het Prelinger Archief en later andere collecties. Het internetarchief omvat begin 2021 een collectie van ruim 28 miljoen boeken en teksten, zes miljoen video's en films, 14 miljoen audiobestanden, 580.000 computerprogramma's en 3,5 miljoen beeldbestanden. Het webarchief van Wayback Machine bevat nu meer dan 475 miljard webpagina's. [2]

Voor 2014 meldde het project dat gegevens waren opgeslagen op 20.000 harde schijven in vier datacenters . Een mirrorserver van de gegevens uit San Francisco staat onder meer in de Egyptische Bibliotheca Alexandrina . Begin 2021 bereikte de collectie een omvang van meer dan 45 petabyte . [3]

Het archief is sinds mei 2007 officieel erkend als bibliotheek door de Amerikaanse staat Californië . [4]

Sinds de verkiezingen van 8 november 2016 is het Internet Archive van plan om een ​​permanent bijgewerkte kopie in Canada te deponeren , aldus zijn website . [5]

Diensten

audio

Het audioarchief bevat sinds 2017 ruim drie miljoen geluidsopnames . Deze variëren van radioshows en radio -uitzendingen tot audioboeken , poëzievoordrachten , live concertopnames en muziek die door gebruikers is geüpload. Het archief kan ook worden gebruikt om podcasts te publiceren . [6]

afbeeldingen

In het beeldarchief zijn al meer dan 1¼ miljoen beeldbestanden beschikbaar. Dit zijn afbeeldingen van kunstwerken , zoals een verzameling afbeeldingen uit het Metropolitan Museum of Art met meer dan 100.000 inzendingen, afbeeldingen van historische kaarten, astronomische afbeeldingen van NASA , platenhoezen en ook vrij beschikbare afbeeldingen van particulieren .

software

De Library of Congress heeft in december 2006 zes uitzonderingen toegestaan ​​op de Digital Millennium Copyright Act . [7] Het internetarchief kan dus computersoftware of games opslaan die desertware zijn geworden [ 8] met de bedoeling ze te behouden wanneer de originele hardware, formaten of technologie verouderd zijn. In 2013 begon het internetarchief met het aanbieden van klassieke games als speelbare webbrowserstreaming via MESS- emulatie [9] , b.v. B. de Atari 2600 -videogame ET the Extra-Terrestrial. [10] Vanaf 23 december 2014 zullen duizenden klassieke DOS- computerspellen in de browser worden gepresenteerd voor onderwijs- en onderzoeksdoeleinden [11] met behulp van DOSBox- emulatie. [12] [13] [14] [15]

Internetarchieven in San Francisco (1996-2009)
Nieuw hoofdkantoor van het internetarchief sinds november 2009 in een voormalige Christian Science- kerk
Internetarchief in de Bibliotheca Alexandrina . Achter de ruiten bevinden zich de rekken met de archiefcomputers.
Video van een demonstratie van de digitaliseringstechniek van het Internet Archive door Brewster Kahle, 29 maart 2013

songteksten

The Million Book Project digitaliseert en maakt beschikbaar om te downloaden , via het internetarchief, boeken die het publieke domein zijn binnengekomen door het verstrijken van het auteursrecht (Amerikaanse auteursrechtwet ) of om andere redenen . De digitale exemplaren zijn onderdeel van de Open Bibliotheek . Inmiddels zijn er meer dan tien miljoen boeken en teksten gearchiveerd.

Verschillende scancentra (twaalf in totaal in 2009) worden onderhouden, bijvoorbeeld in Richmond . Scannen is per bestelling, tien dollarcent wordt per pagina in rekening gebracht (vanaf 2009). De klanten, meestal bibliotheken, ontvangen de digitale kopie , een tekstbestand gegenereerd door OCR , een permanent internetadres en de mogelijkheid om de digitale kopie op de servers van de vereniging op te slaan. [16] Ook zijn er samenwerkingsovereenkomsten met zelfdigitaliserende bibliotheken voor losse diensten zoals OCR en redundante hosting.

Boeken

Om de geloofwaardigheid van citaten uit boeken in Wikipedia waarnaar wordt verwezen te verbeteren , is er sinds 2019 een samenwerking tussen Wikipedia en het internetarchief . Er is een begin gemaakt met het toevoegen van digitale scans van de geciteerde boeken aan de verwijzingen in Wikipedia-artikelen. [17] De betreffende passage wordt elk op twee pagina's gepresenteerd. Een voorbeeld hiervan is citaat nummer 163 [18] (vanaf 26 april 2022) in het Engelstalige artikel over Martin Luther King .

Open access publicaties

In september 2020 presenteerde het Internet Archive een initiatief voor het archiveren en open access beschikbaar stellen van publicaties onder de naam "Internet Archive Scholar" [19] .

films

Onder de rubriek "Films" biedt het internetarchief meer dan 85.000 films (vanaf februari 2022), waaronder tal van oude klassiekers. Ook trailers en korte films maken deel uit van het aanbod, evenals diverse propagandafilms uit de tijd van de Tweede Wereldoorlog . [20]

Onder de meer dan 3.500 stomme films zijn 437 films in de categorie "Silent Hall of Fame" met vroege werken van Charlie Chaplin of Buster Keaton , maar ook van Duitse regisseurs als Robert Wiene (onder meer vertegenwoordigd door Das Cabinet des Dr. Caligari uit 1920) anderen). Het speelfilmaanbod wordt aangevuld met vroege documentaires, b.v. B. toont de aankomst van Europese immigranten in 1909 op Ellis Island (door Billy Bitzer ). [21] De bekende genreklassiekers van Georges Méliès zijn natuurlijk vertegenwoordigd in de apart vermelde collectie , zoals de 16 minuten durende stomme film Journey to the Moonuit 1902. [22]

Naast experimentele films van bekende regisseurs als Ingmar Bergman (o.a. Persona , 1966), zijn er ook klassiekers van grootmeester Alfred Hitchcock . is vertegenwoordigd met In the Shadow of Doubt (1946). De Spanjaard Segundo de Chomón heeft ook zijn eigen rubriek, net als de Duitse experimentele filmmaker Lutz Mommartz en de Oostenrijker Johann Schwarzer . Er worden verschillende genres geserveerd, er is zowel historisch als een sectie met bijna 300 filmkomedies [23] en meer dan 450 sciencefiction- en horrorfilms, zoals B. Nosferatu - Een symfonie van horror door Friedrich Wilhelm Murnau (1922). [24] Naast zeldzame grindhouse- en exploitatiefilms [25] zoals Sex Madness (1938) of Begotten ( E. Elias Merhige , 1989) en cyberpunkwerken zoals Tetsuo: The Iron Man van de Japanse Shin'ya Tsukamoto .

De film noir is vertegenwoordigd met 700 on-demand items, waaronder Temptation Street van Fritz Lang (1946) en The Third Man van Carol Reed (1949). [26]

Er zijn ook meer dan 7.000 films en video's met sportthema [27] , animatiefilms en korte films [28] , evenals meer dan 16.000 inhoud met een kunst- en muziekthema [29] en meer dan 100.000 visuele artikelen over religie en spiritualiteit . [30]

videospellen

In 2013 begon het internetarchief met het aanbieden van klassieke games als speelbare webbrowserstreaming via MESS- emulatie . [9]

sites

Wayback Machine-logo

De Wayback Machine (“Take Me Back”) is een online service waarmee u verschillende versies van opgeslagen webpagina's kunt ophalen. De pagina's die moeten worden opgeslagen, worden geselecteerd via de Alexa-internetservice . Alle daar opgeslagen URL's worden regelmatig opgeroepen en gearchiveerd. U kunt een niet-opgeslagen internetbron ook handmatig opnemen door naar de pagina te zoeken en vervolgens de opname te bevestigen (bestandsinhoud, bijv. JPG - afbeeldingen, wordt opgeslagen zonder voorafgaande prompt). Het totale volume bedroeg in november 2009 ongeveer 150 miljard pagina's en groeide in maart 2020 tot meer dan 625 miljard pagina's.

Een andere webarchiefdienst voor individuele webarchivering werd in 2006 beschikbaar gesteld met Archive-It . Instellingen en particulieren hebben de mogelijkheid om digitale back-ups van hun collecties te maken en zelf de vrijgave van de gegevens te bepalen. Archive-It heeft meer dan 400 partners uit 16 landen over de hele wereld, voornamelijk bestaande uit universiteiten, staatsarchieven, musea en kunstbibliotheken, openbare bibliotheken en andere openbare instellingen en NGO's . Archive-It biedt deelnemende partners een full- text search op hun content, maar ook de mogelijkheid om metadata verrijkte gestructureerde datasets voor onderzoekers te exporteren. [31]

De opname van het Prelinger-archief [32] in 1999 was de eerste uitbreiding van het internetarchief die verder ging dan webarchivering. Tegenwoordig bevat het ruim drie miljoen video's en films die onder een vrije licentie of in het publieke domein vallen. Ook wordt hier gewerkt aan een archief voor televisieprogramma 's .

financiering

Het Internetarchief wordt gefinancierd door donaties en subsidies van verschillende stichtingen, instituten en verenigingen op het gebied van onderwijs, onderzoek, wetenschap, etc. In april 2019 heeft het Internetarchief de volgende donateurs aangewezen: Andrew W. Mellon Foundation , Council on Library en Informatiebronnen , Democratiefonds van de Verenigde Naties Federal Communications Commission Universal Service Program for Schools and Libraries (E-Rate) Institute of Museum and Library Services (IMLS) Knight Foundation Laura en John Arnold Foundation National Endowment for the Humanities ( Office of Digital Humanities), National Science Foundation , Peter en Carmen Lucia Buck Foundation , Philadelphia Foundation , Rita Allen Foundation . [2]

Zie ook

literatuur

  • Alexis Rossi: Federale diversiteit - Wereldwijde connectiviteit: staatsstrategieën voor cultureel erfgoed in de digitale wereld . Uitgever: Hamburg University Press, uitgeverij van de Hamburgse Staats- en Universiteitsbibliotheek Carl von Ossietzky (=  cultureel erfgoed in de digitale wereld ). 1e editie. Hamburg 2016, ISBN 978-3-943423-34-1 , Internetarchief, p. 224-237 ( oopen.org ).

web links

Commons : Internetarchief  - Verzameling van afbeeldingen, video's en audiobestanden

specificatie's

  1. Internetarchief, Prelinger-archieven en Project Gutenberg Literary Archive Foundation. In: harvard.edu. Ontvangen op 27 februari 2021 (Engels).
  2. a b c Over het internetarchief. In: archief.org. Ontvangen 10 februari 2021 (Engels).
  3. Petabox. In: archief.org. Ontvangen op 27 februari 2021 (Engels).
  4. Internet Archive officieel een bibliotheek. Internetarchiefforum. In: archief.org. 2007 25 juni, geraadpleegd 2021 (Engels).
  5. Brewster Kahle: help ons het archief gratis, toegankelijk en voor de lezer privé te houden. Internetarchiefblogs. In: archief.org. 29 november 2016, opgehaald op 21 april 2017 (Engels).
  6. Podcast MP3 hosten op Archive.org . In: Turbo Toekomst . ( turbofuture.com [geraadpleegd op 4 augustus 2017]).
  7. Internet Archive wint uitstel van auteursrecht. In: theregister.co.uk. Het register, 1 december 2006, geraadpleegd op 23 maart 2021 .
  8. Ross Miller: US Copyright Office verleent de rechten op afschaffing van software In : joystiq.com . Ontvangen 7 februari 2013.
  9. a b Tilman Baumgärtel: Timothy Leary, de ontwikkelaar van games . In : zeit.de. tijd online . 14 november 2013. Ontvangen 14 november 2013: "Hoe historische computerspellen te krijgen? Het internetarchief streamt tientallen klassiekers, in New York worden games van Timothy Leary verwerkt voor onderzoek – omdat het internetarchief de games ‘streamt’, d.w.z. je laadt ze niet op je eigen computer, je maakt geen inbreuk op het auteursrecht als je maakt gebruik van de programma's.”
  10. Adi Robertson: The Internet Archive plaatst Atari-spellen en verouderde software rechtstreeks in uw browser ( Engels ) In: The Verge . 25 oktober 2013. Ontvangen op 29 oktober 2013.
  11. Gebruiksvoorwaarden, privacybeleid en auteursrechtbeleid archive.org van Internet Archive . 31 december 2014. Ontvangen op 8 januari 2015: "Toegang tot de collecties van het archief wordt u kosteloos verleend en wordt alleen verleend voor beurzen en onderzoeksdoeleinden."
  12. Abby Ohlheiser: Je kunt nu bijna 2.400 MS-DOS-videogames spelen in je browser ( Engels ) In: The Washington Post . 5 januari 2015. Ontvangen op 8 januari 2015.
  13. Elke nieuwe laars een wonder door Jason Scott (23 december 2014)
  14. collection: softwarelibrary_msdos op Internet Archive (29 december 2014)
  15. Kris Graft: Het opslaan van de geschiedenis van videogames begint nu . Gamasutra. 5 maart 2015 . Ontvangen 5 maart 2015 .
  16. Christoph Drösser: Het digitale Alexandrië. In: Die Zeit 2008, No. 4. 17 januari 2008, opgehaald op 23 maart 2021 .
  17. Süddeutsche Zeitung: Fotobewijs. Ontvangen 14 november 2019 .
  18. ^ Drew Hansen, The Dream: Martin Luther King Jr. en de toespraak die een natie inspireerde . HarperCollins, 2005, ISBN 978-0-06-008477-6p98 .
  19. Internetarchief: hoe het internetarchief zorgt voor permanente toegang tot open access tijdschriftartikelen. 15 september 2020, opgehaald op 24 oktober 2020 (Engels).
  20. Films internetarchief, geopend op 21 februari 2022
  21. Silent Hall of Fame Internet Archive, toegankelijk op 21 februari 2022
  22. The Georges Méliès Collection Internet Archive, geraadpleegd op 21 februari 2022
  23. Comedy Films Internet Archive, geopend op 21 februari 2022
  24. Sci-Fi / Horror Internet Archive, geopend op 21 februari 2022
  25. Picfixer Feature Film Collection Internet Archive geopend op 21 februari 2022
  26. Film Noir Internet Archive, geopend op 21 februari 2022
  27. ↑ Internetarchief sportvideo 's , geraadpleegd op 21 februari 2022
  28. Animatie en tekenfilms Internetarchief geopend op 21 februari 2022
  29. ↑ Internetarchief Kunst en muziek , geopend op 21 februari 2022
  30. ↑ Internetarchief Spiritualiteit en religie , geraadpleegd op 21 februari 2022
  31. Over Archive-It. In: archive-it.org. Ontvangen op 23 maart 2021 (Engels).
  32. Tim Brookes: Prelinger-archief: duizenden oude films om te bekijken, te remixen en te gebruiken in je eigen projecten (dingen om te bekijken). In: makeuseof.com. 30 juli 2012, teruggehaald 29 oktober 2016 (Engels).

Coördinaten: 37° 46′ 56.3″  N , 122° 28′ 17.6″  W