Kommagescheiden bestand

Uit Wikipedia, de vrije encyclopedie
Ga naar: navigatie, zoeken
Kommagescheiden bestand
voorbeeld van een *.csv
voorbeeld van een *.csv
Bestandsextensie .csv of .txt
MIME-type text/csv
Portaal  Portaalicoon   Informatica

Een kommagescheiden bestand, of CSV-bestand, in het Engels comma-separated values, is een specificatie voor tabelbestanden. De term moet niet te letterlijk genomen worden, want varianten, zoals met een puntkomma als scheidingsteken, worden ook zo genoemd.

Het CSV-formaat is een eenvoudig en oud databaseformaat. Het bestaat enkel uit tekstgegevens, waardoor het gemakkelijk geïmplementeerd (lezen en/of schrijven) kan worden en een brede verspreiding kent. Waarden worden in principe gescheiden door komma's, en regels door het nieuweregelteken.

Dit soort bestanden wordt vaak gebruikt om de inhoud op te slaan van logboeken, firewalls of tabellen met daarin de gegevens van mutaties of transacties (zoals die op een bankrekening of met een OV-chipkaart).

Deze gegevens kunnen in een rekenblad- of een databaseprogramma worden ingelezen en vervolgens op een beeldscherm als tabel worden gepresenteerd.

Voorbeeld[bewerken]

jaar merk type omschrijving prijs
1997 Ford E350 airco, abs, moon 3000.00
1999 Chevy Type "Extended Edition"   4900.00
1996 Jeep Grand Cherokee IS VERKOCHT!
air, moon roof, loaded
4799.00

De bovenstaande tabel ziet er als CSV-bestand als volgt uit:

jaar,merk,type,omschrijving,prijs
1997,Ford,E350,"airco, abs, moon",3000.00
1999,Chevy,"Type ""Extended Edition""",,4900.00
1996,Jeep," Grand Cherokee ","IS VERKOCHT!
air, moon roof, loaded",4799.00

Het bovenstaande illustreert de volgende regels:

  • Velden met een komma, aanhalingstekens (") of regel-einden, en velden die met een spatie beginnen of eindigen, worden omsloten door aanhalingstekens.
  • Aanhalingstekens binnen een veld worden verdubbeld.

Varianten[bewerken]

Nederlandstalige spreadsheet-programma's gebruiken vaak de puntkomma als scheidingsteken, omdat de komma als decimaalteken en eventueel de punt als cijfergroeperingssymbool (duizend-separator) wordt gebruikt. Dit voorkomt dat er steeds aanhalingstekens om geldbedragen nodig zijn.

Spreadsheet-programma's zijn vaak voorzien van een wizard die helpt bij het inlezen van tekstbestanden waar de kolommen door een bepaald teken zijn gescheiden. Onder het voorbeeld is te zien hoe bijvoorbeeld een komma in een getal wordt 'behandeld' in een kommagescheiden bestand.

Bij het op het klembord kopiëren van een gerenderde html-tabel en plakken in een teksteditor ontstaat een variant van een kommagescheiden bestand, met het tab-karakter als scheidingsteken. Zowel bij rechtstreeks plakken van het klembord als bij het plakken van dit bestand in een spreadsheet, wordt de tabel daarnaar overgebracht.

Nieuweregelteken[bewerken]

Soms worden in een kommagescheiden bestand tabelregels slechts gescheiden door line feed, terwijl dat bestand gebruikt wordt voor het overbrengen van een tabel naar een systeem dat carriage return line feed vereist als nieuweregelteken. Bekeken in een teksteditor staan de tabelregels dan niet op aparte regels. Voor het spreadsheetprogramma is de linefeed vaak toch voldoende, zodat de overbrenging wel werkt.

Externe links[bewerken]