Internet arkiver | |
---|---|
"Universal adgang til al viden" | |
Webarkivering / Digitalt Bibliotek | |
Sprog | engelsk |
Sæde | San Francisco , Californien , USA![]() |
grundlægger | Brewster Bald |
operatør | Internet arkiver |
redaktionen | Brewster Bald |
Registrering | valgfri |
On-line | 1996 |
https://archive.org/ |
Internet Archive i San Francisco er et non-profit projekt grundlagt af Brewster Kahle i 1996 og har haft officiel biblioteksstatus siden 2007. Det blev startet som et rent webarkiv , hvor man kan se arkiverede hjemmesider ved hjælp af den såkaldte Wayback Machine . Fra 1999 og frem kom yderligere arkiver til, så det nu er et digitalt bibliotek bestående af vigtige samlinger af tekster og bøger, lydfiler, videoer, billeder og software. Internetarkivet har langtidsarkiveringdigitale data i en frit tilgængelig form og lægger stor vægt på adgangsmuligheder for blinde eller på anden måde begrænsede brugere.
Ud over sin funktion som arkiv ser Internetarkivet sig selv som en aktivist for et åbent og frit internet og bevaring og distribution af værker i det offentlige domæne . [1]
Brewster Kahle grundlagde Internet Archive i maj 1996 som en 501 ( c)(3) non-profit organisation . Den modtog en stor datalevering fra Alexa Internet lige i starten . Som en del af webarkivering gemmer den såkaldte mementoer , dvs. H. Snapshots af websteder og Usenet- bidrag. [2]
Fra 1999 og fremefter blev målet udvidet til at omfatte et omfattende, frit tilgængeligt bibliotek gennem inddragelsen af Prelingerarkivet og senere andre samlinger. I begyndelsen af 2021 omfatter Internet Archive en samling på over 28 millioner bøger og tekster, seks millioner videoer og film, 14 millioner lydfiler, 580.000 computerprogrammer og 3,5 millioner billedfiler. Wayback Machine - webarkivet indeholder nu mere end 475 milliarder websider. [2]
For 2014 rapporterede projektet, at data blev lagret på 20.000 harddiske i fire datacentre . En spejlserver af dataene fra San Francisco er blandt andet placeret i den egyptiske Bibliotheca Alexandrina . I begyndelsen af 2021 nåede samlingen over 45 petabyte i størrelse . [3]
Arkivet har været officielt anerkendt som et bibliotek af den amerikanske stat Californien siden maj 2007. [4]
Siden valget den 8. november 2016 planlægger Internet Archive at deponere en permanent opdateret kopi i Canada , ifølge dets hjemmeside . [5]
Lydarkivet har siden 2017 indeholdt over tre millioner lydoptagelser . Disse spænder fra radioshows og radiofunktioner til lydbøger , digtoplæsninger , livekoncertoptagelser og musik uploadet af brugere. Arkivet kan også bruges til at udgive podcasts . [6]
Mere end 1¼ million billedfiler er allerede tilgængelige i billedarkivet. Det er billeder af kunstværker , såsom en samling af billeder fra Metropolitan Museum of Art med over 100.000 poster, billeder af historiske kort, astronomiske billeder fra NASA , pladeomslag og også frit tilgængelige billeder fra privatpersoner .
Library of Congress tildelte seks undtagelser fra Digital Millennium Copyright Act i december 2006. [7] Internetarkivet kan således opbevare computersoftware eller spil , der er blevet abandonware [8] med den hensigt at bevare dem, når den originale hardware, formater eller teknologi er forældet. I 2013 begyndte Internet Archive at tilbyde klassiske spil som spilbar webbrowser- streaming via MESS -emulering [9] , f.eks. B. Atari 2600 videospillet ET the Extra-Terrestrial. [10] Fra den 23. december 2014 vil tusindvis af klassiske DOS -computerspil blive præsenteret i browseren til undervisnings- og forskningsformål [11] ved hjælp af DOSBox- emulering. [12] [13] [14] [15]
Million Book Project digitaliserer og gør bøger tilgængelige til download via internetarkivet, der er blevet offentligt ejendomsret på grund af ophavsrettens udløb (amerikansk lov om ophavsret ) eller andre årsager . De digitale kopier er en del af Åbent Bibliotek . I mellemtiden er mere end ti millioner bøger og tekster blevet arkiveret.
Flere scanningscentre (tolv i alt i 2009) opretholdes, for eksempel i Richmond . Scanning er pr. ordre, ti amerikanske cents opkræves pr. side (fra 2009). Klienterne, for det meste biblioteker, modtager den digitale kopi , en tekstfil genereret af OCR , en vedvarende internetadresse og mulighed for at gemme den digitale kopi på foreningens servere. [16] Der er også samarbejdsaftaler med selvdigitaliserende biblioteker for individuelle tjenester som OCR og redundant hosting.
For at forbedre troværdigheden af refererede citater fra bøger i Wikipedia har der været et samarbejde mellem Wikipedia og Internet Archive siden 2019 . Der er startet på at tilføje digitale scanninger af de citerede bøger til referencerne i Wikipedia-artikler. [17] Den pågældende passage er præsenteret på to sider hver. Et eksempel på dette er citat nummer 163 [18] (pr. 26. april 2022) i den engelsksprogede artikel om Martin Luther King .
I september 2020 præsenterede Internet Archive et initiativ til arkivering og tilgængeliggørelse af publikationer med åben adgang under navnet "Internet Archive Scholar" [19] .
Under afsnittet "Film" tilbyder Internet Archive over 85.000 film (fra februar 2022), inklusive adskillige gamle klassikere. Trailere og kortfilm er også en del af tilbuddet samt diverse propagandafilm fra Anden Verdenskrigs tid . [20]
De mere end 3.500 stumfilm omfatter 437 film i kategorien "Silent Hall of Fame" med tidlige værker af Charlie Chaplin eller Buster Keaton , men også af tyske instruktører som Robert Wiene (repræsenteret af Das Cabinet des Dr. Caligari fra 1920, bl.a. andre). Udvalget af spillefilm suppleres af tidlige dokumentarer, bl.a. B. viser europæiske immigranters ankomst til Ellis Island i 1909 (af Billy Bitzer ). [21] Georges Méliès ' velkendte genreklassikere er naturligvis repræsenteret i den separat opførte samling , såsom den 16 minutter lange stumfilm Journey to the Moonfra 1902. [22]
Udover eksperimenterende film af kendte instruktører som Ingmar Bergman (f.eks. Persona , 1966) er der også klassikere af stormester Alfred Hitchcock . er repræsenteret med In the Shadow of Doubt (1946). Spanieren Segundo de Chomón har også sin egen rubrik, ligesom den tyske eksperimentelle filmskaber Lutz Mommartz og østrigske Johann Schwarzer . Der serveres forskellige genrer, der er både historisk og en afdeling med næsten 300 filmkomedier [23] og over 450 science fiction- og gyserfilm, såsom B. Nosferatu - En gysersymfoni af Friedrich Wilhelm Murnau (1922). [24] Ud over sjældne grindhouse- og udnyttelsesfilm [25] såsom Sex Madness (1938) eller Begotten ( E. Elias Merhige , 1989) og cyberpunk-værker som Tetsuo: The Iron Man af japaneren Shin'ya Tsukamoto .
Film noir er repræsenteret med 700 on-demand elementer, herunder Temptation Street af Fritz Lang (1946) og The Third Man af Carol Reed (1949). [26]
Der er også over 7.000 film og videoer med sportstema [27] , animerede film og kortfilm [28] samt over 16.000 kunst- og musiktema-indhold [29] og over 100.000 visuelle artikler om religion og spiritualitet . [30]
I 2013 begyndte Internet Archive at tilbyde klassiske spil som spilbar webbrowser- streaming via MESS -emulering . [9]
Wayback Machine (“Take Me Back”) er en onlinetjeneste, der giver dig mulighed for at hente forskellige versioner af gemte websider. De sider, der skal gemmes, vælges via Alexas internettjeneste . Alle URL'er , der er gemt der , kaldes op og arkiveres regelmæssigt. Du kan også optage en ikke-gemt internetressource manuelt ved at søge efter siden og derefter bekræfte optagelsen (filindhold, f.eks. JPG - billeder, gemmes uden forudgående prompt). Det samlede volumen var omkring 150 milliarder sider i november 2009 og voksede til over 625 milliarder sider i marts 2020.
En anden webarkivtjeneste til individuel webarkivering blev gjort tilgængelig i 2006 med Archive-It . Institutioner og enkeltpersoner har mulighed for at lave digitale sikkerhedskopier af deres samlinger og selv bestemme frigivelsen af dataene. Archive-It har over 400 partnere fra 16 lande rundt om i verden, primært bestående af universiteter, statsarkiver, museer og kunstbiblioteker, offentlige biblioteker og andre offentlige institutioner og NGO'er . Archive-It tilbyder deltagende partnere en fuldtekstsøgning på deres indhold, men også muligheden for at eksportere metadataberigede strukturerede datasæt til forskere. [31]
Inkluderingen af Prelinger Archives [32] i 1999 var den første udvidelse af Internet Archive ud over webarkivering. I dag indeholder den godt tre millioner videoer og film , der er under frie licenser eller offentligt domæne. Her arbejdes der også på et arkiv for tv- programmer .
Internet Archive er finansieret af donationer og bevillinger fra forskellige fonde, institutter og foreninger inden for uddannelse, forskning, videnskab osv. Internet Archive angav i april 2019 følgende donorer: Andrew W. Mellon Foundation , Council on Library og Informationsressourcer , United Nations Democracy Federal Communications Commission Universal Service Program for Schools and Libraries (E-Rate) Institute of Museum and Library Services (IMLS) Knight Foundation Laura and John Arnold Foundation National Endowment for the Humanities ( Office of Digital Humanities), National Science Foundation , The Peter and Carmen Lucia Buck Foundation , The Philadelphia Foundation , Rita Allen Foundation . [2]
Koordinater: 37° 46′ 56,3″ N , 122° 28′ 17,6″ W