Internet Archive

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken
Het huidige hoofdkantoor van het Internetarchief in een voormalige kerk in San Francisco
Internetondernemer Brewster Kahle, stichter van het Internet Archive

Internet Archive (Nederlands: Internetarchief) is een website en project met als doel universele toegang te bieden tot alle menselijke kennis. Het project is begonnen door Brewster Kahle in 1996 en was gevestigd in het Presidio van San Francisco, Californië, Verenigde Staten.

Sinds november 2009 is het gehuisvest in een voormalige Christian Science-kerk in San Francisco.

Collectie[bewerken]

Het voormalige hoofdkantoor in het Presidio, een voormalig militair terrein, tot november 2009 de thuisbasis van het Internetarchief

De collectie omvat:

Wayback Machine[bewerken]

Kopie van het Internet Archive (in de Bibliotheca Alexandrina)

Het archief onderhoudt de Wayback Machine, met inhoud die gedoneerd wordt door Alexa Internet. Nadat een gebruiker een URL opgeeft, zorgt deze machine voor gearchiveerde versies van de website, door de jaren heen. Het archief wacht altijd zes maanden alvorens pagina's online te zetten. In juni 2016 had Interneet Archive 487 miljard webpagina's opgeslagen.

De naam Wayback Machine komt uit een tekenfilmserie, genaamd The Rocky and Bullwinkle Show. De hond Mr. Peabody en zijn assistent, een jongen genaamd Sherman, gebruiken een tijdmachine, genaamd de WABAC Machine om beroemde gebeurtenissen uit het verleden te bezoeken.

Boeken[bewerken]

De grootste collectie die daarnaast door Internet Archive beschikbaar wordt gesteld, bestaat uit boeken. In juni 2016 stelde het meer dan 10 miljoen teksten online ter beschikking, waarvan 2,3 miljoen afkomstig waren uit Amerikaanse bibliotheken.

Films[bewerken]

Internet Archive heeft onder de categorie Moving Images een gevarieerd aanbod aan audiovisueel materiaal. In juni 2016 bestond de collectie uit meer dan 2,5 miljoen films en filmpjes.[1]

Subcollecties van Moving Images zijn:

Filmkenner Rick Prelinger digitaliseerde meer dan 2000 filmpjes voor Internet Archive

Geluidsopnames[bewerken]

Onder de categorie "Audio" bevinden zich meer dan 2,9 miljoen geluidsopnames. De muzieksectie omvat grotendeels muziek van onafhankelijke artiesten, die zich laten vertegenwoordigen door zogenaamde netlabels. Daarnaast is er een grote collectie live-opnames van artiesten, die een open beleid voeren ten aanzien van geluidsopnames van hun concerten, zoals de Grateful Dead, Jefferson Starship, Ryan Adams, en Alejandro Escovedo. Verder zijn er collecties audioboeken, gedichten, hoorspelen en colleges te vinden.

Omvang en opslag[bewerken]

De totale omvang van het archief bedroeg in 2003 ongeveer 100 terabyte aan gegevens, met een groeicijfer van 12 terabyte per maand. In 2004 bereikte het een grootte van meer dan een petabyte, met een groeicijfer van 20 terabyte per maand. Dit is inclusief 40 miljard webpagina's. Een kopie van de gegevens wordt ook bijgehouden in de Bibliotheca Alexandrina in het Egyptische Alexandrië. In oktober 2012 werd de mijlpaal van 10 petabyte bereikt.[2]

Licenties[bewerken]

De meeste films, boeken en geluidsopnames vallen onder het publieke domein of vallen onder de Creative Commons-licentie.
De live-opnames van artiesten kunnen bestaan omdat die artiesten een open beleid voeren bij hun optredens, maar dat maakt de muziek zelf nog niet vrij van auteursrechten.

Controverse[bewerken]

Verwijdering van Scientologysites[bewerken]

Eind 2002 verwijderde het Internet Archive verschillende websites uit de Wayback Machine die kritisch waren over Scientology.

De foutmelding die men kreeg bij opvragen van een archiefversie van een verwijderde website, zei dat verwijdering van het origineel was geschied op verzoek van de website zelf. Later bleek echter dat advocaten van de Scientologykerk geëist hadden dat het materiaal zou worden verwijderd en dat de websites zelf daar helemaal niet om hadden gevraagd.

Ongevraagd kopiëren[bewerken]

Critici wijzen op het gegeven dat de Internet Archive ongevraagd kopieën maakt van websites die niet onder een vrije licentie vallen (zoals het publieke domein of Creative Commons). Als reactie wijst Internet Archive erop dat de opgeslagen gegevens altijd op verzoek van de websites zelf verwijderd kunnen worden of dat websites met behulp van robots.txt de toegang voor Internet Archive kunnen blokkeren.

Zie ook[bewerken]

Externe links[bewerken]

Algemeen[bewerken]

Voorbeelden Wayback Machine[bewerken]