Archives Internet | |
---|---|
"Accès universel à toutes les connaissances" | |
Archivage Web / Bibliothèque numérique | |
Langues | Anglais |
Siège | San Francisco , Californie , États-Unis![]() |
fondateur | Brasseur chauve |
opérateur | Archives Internet |
rédaction | Brasseur chauve |
Inscription | optionnel |
En ligne | 1996 |
https://archive.org/ |
L' Internet Archive à San Francisco est un projet à but non lucratif fondé par Brewster Kahle en 1996 et a le statut de bibliothèque officielle depuis 2007. Il a été lancé comme une archive Web pure , où vous pouvez afficher des sites Web archivés à l'aide de la soi-disant Wayback Machine . À partir de 1999, d'autres archives ont été ajoutées, de sorte qu'il s'agit désormais d'une bibliothèque numérique comprenant d'importantes collections de textes et de livres, de fichiers audio, de vidéos, d'images et de logiciels. Internet Archive dispose d'un archivage à long termedonnées numériques sous une forme librement accessible et attache une grande importance aux options d'accès pour les utilisateurs aveugles ou autrement restreints.
Outre sa fonction d'archive, Internet Archive se considère également comme un militant pour un Internet ouvert et libre et pour la préservation et la diffusion des œuvres du domaine public . [1]
Brewster Kahle a fondé Internet Archive en mai 1996 en tant qu'organisation à but non lucratif 501 ( c)(3) . Il a reçu une grande quantité de données d' Alexa Internet dès le début . Dans le cadre de l'archivage Web , il stocke ce que l'on appelle des souvenirs , c'est-à-dire. H Instantanés de sites Web et contributions Usenet . [2]
À partir de 1999, l'objectif a été élargi pour inclure une bibliothèque complète et librement accessible grâce à l'inclusion des archives Prelinger et plus tard d'autres collections. Début 2021, Internet Archive comprend une collection de plus de 28 millions de livres et de textes, six millions de vidéos et de films, 14 millions de fichiers audio, 580 000 programmes informatiques et 3,5 millions de fichiers images. L' archive Web Wayback Machine contient désormais plus de 475 milliards de pages Web. [2]
Pour 2014, le projet a signalé que les données étaient stockées sur 20 000 disques durs dans quatre centres de données . Un serveur miroir des données de San Francisco est situé entre autres dans la Bibliotheca Alexandrina égyptienne . Début 2021, la collection atteignait plus de 45 pétaoctets . [3]
Les archives sont officiellement reconnues comme bibliothèque par l'État américain de Californie depuis mai 2007. [4]
Depuis l' élection du 8 novembre 2016 , Internet Archive envisage de déposer une copie mise à jour en permanence au Canada , selon son site Internet . [5]
Les archives audio contiennent plus de trois millions d'enregistrements sonores depuis 2017 . Celles-ci vont des émissions de radio et des reportages radio aux livres audio , aux lectures de poésie , aux enregistrements de concerts en direct et à la musique téléchargée par les utilisateurs. L'archive peut également être utilisée pour publier des podcasts . [6]
Plus d'1¼ million de fichiers d'images sont déjà disponibles dans les archives d'images. Ce sont des images d' œuvres d' art , comme une collection d'images du Metropolitan Museum of Art avec plus de 100 000 entrées, des images de cartes historiques, des images astronomiques de la NASA , des pochettes de disques et aussi des images librement disponibles auprès de particuliers .
La Bibliothèque du Congrès a accordé six exceptions au Digital Millennium Copyright Act en décembre 2006. [7] L'Internet Archive peut ainsi stocker des logiciels ou des jeux informatiques qui sont devenus des abandonwares [8] avec l'intention de les conserver lorsque le matériel, les formats ou la technologie d'origine sont obsolètes. En 2013, Internet Archive a commencé à proposer des jeux classiques sous forme de streaming de navigateur Web jouable via l'émulation MESS [9] , par ex. B. le jeu vidéo Atari 2600 ET l'extra-terrestre. [10] À partir du 23 décembre 2014, des milliers de jeux informatiques DOS classiques seront présentés dans le navigateur à des fins d'enseignement et de recherche [11] en utilisant l' émulation DOSBox . [12] [13] [14] [15]
Le Million Book Project numérise et met à disposition pour téléchargement , via Internet Archive, les livres qui sont entrés dans le domaine public suite à l'expiration du droit d'auteur (loi américaine sur le droit d'auteur ) ou pour d'autres raisons . Les copies numériques font partie de l ' Open Library . Entre-temps, plus de dix millions de livres et de textes ont été archivés.
Plusieurs centres de numérisation (douze au total en 2009) sont maintenus, par exemple à Richmond . La numérisation est par commande, dix cents américains sont facturés par page (à partir de 2009). Les clients, principalement des bibliothèques, reçoivent la copie numérique , un fichier texte généré par OCR , une adresse Internet persistante et la possibilité de stocker la copie numérique sur les serveurs de l'association. [16] Il existe également des accords de coopération avec des bibliothèques autonumérisées pour des services individuels tels que l'OCR et l'hébergement redondant.
Afin d'améliorer la crédibilité des citations référencées de livres dans Wikipédia , une coopération existe entre Wikipédia et Internet Archive depuis 2019 . Un début a été fait pour ajouter des scans numériques des livres cités aux références dans les articles de Wikipédia. [17] Le passage en question est présenté sur deux pages chacun. Un exemple de ceci est la citation numéro 163 [18] (en date du 26 avril 2022) dans l'article en anglais sur Martin Luther King .
En septembre 2020, Internet Archive a présenté une initiative d'archivage et de mise à disposition de publications en libre accès sous le nom "Internet Archive Scholar" [19] .
Dans la section "Films", Internet Archive propose plus de 85 000 films (en février 2022), dont de nombreux vieux classiques. Bandes-annonces et courts métrages font également partie de l'offre, ainsi que divers films de propagande de l'époque de la Seconde Guerre mondiale . [20]
Parmi les plus de 3 500 films muets, on compte 437 films dans la catégorie "Silent Hall of Fame" avec des œuvres de jeunesse de Charlie Chaplin ou Buster Keaton , mais aussi de réalisateurs allemands comme Robert Wiene (représenté par Das Cabinet des Dr Caligari à partir de 1920, parmi les autres). La gamme de longs métrages est complétée par des documentaires anciens, par ex. B. montrant l'arrivée en 1909 d'immigrants européens à Ellis Island (par Billy Bitzer ). [21] Les classiques du genre bien connus de Georges Méliès sont bien sûr représentés dans la collection répertoriée séparément , comme le film muet de 16 minutes Journey to the Moonà partir de 1902. [22]
En plus des films expérimentaux de réalisateurs bien connus comme Ingmar Bergman (par exemple Persona , 1966), il y a aussi des classiques du grand maître Alfred Hitchcock . est représenté avec In the Shadow of Doubt (1946). L' Espagnol Segundo de Chomón a aussi sa propre rubrique, tout comme le cinéaste expérimental allemand Lutz Mommartz et l'Autrichien Johann Schwarzer . Différents genres sont servis, il y a à la fois historique et une section avec près de 300 comédies cinématographiques [23] et plus de 450 films de science-fiction et d'horreur, tel que B. Nosferatu - Une symphonie d'horreur de Friedrich Wilhelm Murnau (1922). [24] En plus de rares films de grindhouse et d'exploitation [25] comme Sex Madness (1938) ou Begotten ( E. Elias Merhige , 1989) et des œuvres cyberpunk comme Tetsuo : The Iron Man du Japonais Shin'ya Tsukamoto .
Le film noir est représenté avec 700 titres à la demande, dont Temptation Street de Fritz Lang (1946) et The Third Man de Carol Reed (1949). [26]
Il existe également plus de 7 000 films et vidéos sur le thème du sport [27] , des films d'animation et des courts métrages [28] , ainsi que plus de 16 000 contenus sur le thème de l'art et de la musique [29] et plus de 100 000 articles visuels sur la religion et la spiritualité . [30]
En 2013, Internet Archive a commencé à proposer des jeux classiques sous forme de streaming de navigateur Web jouable via l'émulation MESS . [9]
La Wayback Machine ("Take Me Back") est un service en ligne qui vous permet de récupérer différentes versions de pages Web enregistrées. Les pages à enregistrer sont sélectionnées via le service Internet Alexa . Toutes les URL qui y sont stockées sont appelées et archivées régulièrement. Vous pouvez également enregistrer manuellement une ressource Internet non enregistrée en recherchant la page, puis en confirmant l'enregistrement (le contenu du fichier, par exemple les images JPG , est enregistré sans demande préalable). Le volume total était d'environ 150 milliards de pages en novembre 2009 et est passé à plus de 625 milliards de pages en mars 2020.
Un autre service d'archivage Web pour l'archivage Web individuel a été mis à disposition en 2006 avec Archive-It . Les institutions et les particuliers ont la possibilité de créer des sauvegardes numériques de leurs collections et de déterminer eux-mêmes la diffusion des données. Archive-It compte plus de 400 partenaires de 16 pays à travers le monde, composés principalement d'universités, d'archives d'État, de musées et de bibliothèques d'art, de bibliothèques publiques et d'autres institutions publiques et d' ONG . Archive-It offre aux partenaires participants une recherche en texte intégral sur leur contenu, mais aussi la possibilité d'exporter des ensembles de données structurées enrichies de métadonnées pour les chercheurs. [31]
L'inclusion des archives Prelinger [32] en 1999 a été la première extension des archives Internet au-delà de l'archivage Web. Il contient aujourd'hui un bon trois millions de vidéos et de films qui sont sous licences libres ou domaine public. Une archive des programmes de télévision est également en cours d'élaboration ici .
Internet Archive est financé par des dons et des subventions de diverses fondations, instituts et associations dans les domaines de l'éducation, de la recherche, de la science, etc. En avril 2019, Internet Archive a indiqué les donateurs suivants : Andrew W. Mellon Foundation , Council on Library and Ressources d'information , Fonds des Nations Unies pour la démocratie Commission fédérale des communications Programme de service universel pour les écoles et les bibliothèques (E-Rate) Institut des services de musées et de bibliothèques (IMLS) Fondation Knight Fondation Laura et John Arnold National Endowment for the Humanities ( Office of Digital Humanities), Fondation nationale des sciences , Fondation Peter et Carmen Lucia Buck , Fondation de Philadelphie , Fondation Rita Allen . [2]
Coordonnées : 37° 46′ 56.3″ N , 122° 28′ 17.6″ O