Internet Archive

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken
Het voormalige hoofdkantoor in het Presidio, een voormalig militair terrein, tot november 2009 de thuisbasis van het Internetarchief
Het huidige hoofdkantoor van het Internetarchief in een voormalige kerk
Internet Archive (Bibliotheca Alexandrina)

Internet Archive (Nederlands: Het Internetarchief) is een website en project met als doel universele toegang te bieden tot alle menselijke kennis. Het project is begonnen door Brewster Kahle in 1996 en was gevestigd in het Presidio van San Francisco, Californië, Verenigde Staten.

Sinds november 2009 is het gehuisvest in een voormalige Christian Science-kerk in San Francisco.

Collectie[bewerken]

De collectie omvat:

Wayback Machine[bewerken]

Internetondernemer Brewster Kahle, stichter van het Internet Archive

Het archief onderhoudt de Wayback Machine, met inhoud die gedoneerd wordt door Alexa Internet. Nadat een gebruiker een URL opgeeft, zorgt deze machine voor gearchiveerde versies van de website, door de jaren heen. Het archief wacht altijd zes maanden alvorens pagina's online te zetten.

De naam Wayback Machine komt uit een tekenfilmserie, genaamd The Rocky and Bullwinkle Show. De hond Mr. Peabody en zijn assistent, een jongen genaamd Sherman, gebruiken een tijdmachine, genaamd de WABAC Machine om beroemde gebeurtenissen uit het verleden te bezoeken.

Films[bewerken]

Internet Archive heeft onder de categorie Moving Images een gevarieerd aanbod aan audiovisueel materiaal. In November 2007 bestond de collectie uit meer dan 109.000 films en filmpjes.[1]

Subcollecties van Moving Images zijn:

Filmkenner Rick Prelinger digitaliseerde meer dan 2000 filmpjes voor Internet Archive

Geluidsopnames[bewerken]

Onder de categorie "Audio" bevinden zich meer dan 200.000 geluidsopnames. Net als bij de films is de collectie ingestuurd materiaal het grootste: meer dan 120.000 geluidsbestanden zijn ingestuurd. De muzieksectie omvat grotendeels muziek van onafhankelijke artiesten, die zich laten vertegenwoordigen door zogenaamde netlabels. Daarnaast is er een grote collectie live-opnames van artiesten, die een open beleid voeren ten aanzien van geluidsopnames van hun concerten, zoals de Grateful Dead, Jefferson Starship, Ryan Adams, en Alejandro Escovedo. Verder zijn er collecties audioboeken, gedichten, hoorspelen en colleges te vinden.

Omvang en opslag[bewerken]

De totale omvang van het archief bedroeg in 2003 ongeveer 100 terabyte aan gegevens, met een groeicijfer van 12 terabyte per maand. In 2004 bereikte het een grootte van meer dan een petabyte, met een groeicijfer van 20 terabyte per maand. Dit is inclusief 40 miljard webpagina's. Een kopie van de gegevens wordt ook bijgehouden in de Bibliotheca Alexandrina in het Egyptische Alexandrië. In oktober 2012 werd de mijlpaal van 10 petabyte bereikt.[2]

Licenties[bewerken]

Het meeste van de films, boeken en geluidsopnames vallen onder het publieke domein of vallen onder de Creative Commons-licentie. De live-opnames van artiesten kunnen bestaan omdat die artiesten een open beleid voeren bij hun optredens, maar dat maakt de muziek zelf nog niet vrij van auteursrechten.

Controverse[bewerken]

Verwijdering van Scientologysites[bewerken]

Eind 2002 verwijderde het Internet Archive verschillende websites uit de Wayback Machine die kritisch waren over Scientology.

De foutmelding die men kreeg bij opvragen van een archiefversie van een verwijderde website, zei dat verwijdering van het origineel was geschied op verzoek van de website zelf. Later bleek echter dat advocaten van de Scientologykerk geëist hadden dat het materiaal zou worden verwijderd en dat de websites zelf daar helemaal niet om hadden gevraagd.

Ongevraagd kopiëren[bewerken]

Critici wijzen op het gegeven dat de Internet Archive ongevraagd kopieën maakt van websites die niet onder een vrije licentie vallen (zoals het publieke domein of Creative Commons). Als reactie wijst Internet Archive erop dat de opgeslagen gegevens altijd op verzoek van de websites zelf verwijderd kunnen worden of dat websites met behulp van robots.txt de toegang voor Internet Archive kunnen blokkeren.

Zie ook[bewerken]

Externe links[bewerken]

Algemeen[bewerken]

Voorbeelden Wayback Machine[bewerken]

Bronnen, noten en/of referenties