Overleg:Robots Exclusion Protocol

Uit Wikipedia, de vrije encyclopedie
Naar navigatie springen Naar zoeken springen

Ik vind de uitleg van dit item niet compleet, eerder fout. De engelse uitleg is veel beter. Ik denk dat dit artikel herschreven moet worden. - De voorgaande niet ondertekende opmerking werd toegevoegd door 62.108.7.173 (overleg|bijdragen) .

Ik ben het met je eens dat dat de Engelstalige versie completer is, maar fouten zie ik niet in de Nederlandstalige versie. Oorspronkelijk is deze versie zelfs gebaseerd op de Engelstalige versie. Ik zal kijken of ik tijd heb om het artikel wat uit te breiden, ook al kunnen anderen dat natuurlijk ook. - jeroenvrp 22 mrt 2007 11:55 (CET)

Enkele kleine verbeteringsvoorstellen[bewerken]

Het protocol kent dus 2 implementaties: met een speciaal bestand, of als attribuut in HTML-pagina's. Dat laatste vind ik onvoldoende duidelijk uit de verf komen. Het wordt uitgelegd in de zin

Tevens kan er gebruikt gemaakt worden van een attribuut van de HTML-tag Meta

Hierbij is niet expliciet aangegeven dat de betreffende attribuut in HTML-pagina's moet worden opgenomen - eventueel in alle HTML-pagina's. Lijkt triviaal, maar is het niet (in HTML-pagina's kan immers ook PHP voorkomen en vice versa, om maar een voorbeeld te geven). Ik stel voor:

Als alternatief voor dit speciale bestand kan in bestaande HTML-bestanden middels HTML-tag Meta het attibuut 'robots' worden opgenomen

Verder enkele kleine verbeteringsvoorstellen:

  • Hiervoor wordt gebruik gemaakt van het robots.txt-bestand, diedat in de rootdirectory van een website wordt gezet.
  • Het protocol is echter alleen een advies en vertrouwdt volledig ...
  • Bovenstaande zegt dat alle verkeer dat zich identificeert user-agents die zich identificeren als spambot10000 ...
  • Een voorbeeld van een instructie om een pagina wèl te indexeren, maar niet de links te volgen die in de pagina staan is ...
Ga gerust je gang. Je wijzigingen zien er goed uit. - jeroenvrp 3 apr 2007 21:09 (CEST)