CSV
Een csv ‘comma seperated values’ is een (punt)komma gescheiden bestand. Bij het opstellen van een batch in .csv heeft u de datadictionary nodig.
In het kort
De extensie van het aangeleverd bestand is “.csv”. In de eerste regel van het csv-bestand noteert u de variabele-namen waarvoor u gegevens aan gaat leveren. De variabele namen worden door een puntkomma van elkaar gescheiden. De gegevens worden in de rijen daaronder ingevuld op basis van dezelfde volgorde van de eerste regel van het csv-bestand.
Indien u behoefte heeft aan een voorbeeldbestand voor een registratie dan horen we dit graag. U kunt hiervoor een verzoek inschieten bij onze servicedesk door een mail te sturen naar servicedesk@mrdm.nl of te bellen op +31 (0)88 57 000 30.
De regels
Bij aanlevering in csv gelden de volgende regels voor de samenstelling van het bestand:
- Het eerste record (regel) in het csv-bestand bevat de namen van de aan te leveren variabelen. Een variabele wordt in dit verband ook wel een ‘header’ genoemd. De schrijfwijze van een header dient gelijk te zijn met de schrijfwijze van de variabele uit de datadictionary. Let op! headers zijn hoofdlettergevoelig.
- De velden worden bij voorkeur gescheiden door puntkomma’s. Er kunnen ook andere scheidingstekens dan de puntkomma gebruikt worden, u kunt hierover afspraken maken met MRDM door contact op te nemen met onze servicedesk.
Voorbeeld op basis van puntkomma’s als scheidingsteken
- in de eerste regel ziet u het record met headers
- in de tweede regel ziet u de eerste regel met waarden
- in de derde regel ziet u de tweede regel met waarden. Op variabele 3 is geen waarde aangeleverd.
- var1;var2;var3;var4;var5
- antwoord_variabele_1;antwoord_variabele2;antwoord_variabele3;antwoord_variabele4;antwoord_variabele5
- antwoord_variabele_1;antwoord_variabele2;;antwoord_variabele4;antwoord_variabele5
- Spaties en tabs voorafgaand en volgend op het scheidingsteken worden genegeerd.
- Velden die beginnen of eindigen met spaties moeten worden voorafgegaan en afgesloten met een dubbel citaat teken. De citaat tekens zullen geen onderdeel zijn van de ingelezen data.
- Velden die een dubbel citaat teken bevatten moeten worden voorafgegaan en worden afgesloten met een dubbel citaat teken. Ook ieder dubbel citaat teken in het veld zelf moet worden voorafgegaan en afgesloten met een dubbel citaat teken.
Gebruik van dubbel citaat teken
- in de eerste regel ziet u het record met headers
- in de tweede regel ziet u de eerste regel met waarden. De spatie achter ‘Utrecht’ wordt geïmporteerd.
- in de derde regel ziet u de tweede regel met waarden. De spatie achter de waarde ‘v’ wordt genegeerd.
- in de vierde regel ziet u hoe een waarde met dubbele citaat tekens moet worden aangeleverd.
- geslacht;gebplaats;leeftijd
- m;”Utrecht ”;48
- v ;Amsterdam;56
- m; “Eindhoven ““de gekste”””; 43
- Ieder record is één regel. Een record regeleinde mag bestaan uit een “line feed” (ASCII/LF=0x0A), of een “carriage return en line feed” (ASCII/CRLF=0x0D 0x0A).
- Een waarde kan en mag bestaan uit meerdere regels. Denk hierbij bijvoorbeeld aan een antwoord dat u invult in een vrij-tekst-veld. Wanneer een waarde uit meerdere regels bestaat moet de waarde worden voorafgegaan en worden afgesloten met een dubbel citaat teken
- Als u voor een record op een variabele geen waarde aan kunt leveren dan levert u simpelweg niets aan.
- Het bestand mag geen lege rijen en kolommen bevatten.
Records en regeleinden
- in de eerste regel ziet u het record met headers.
- Op de eerste regel, achter de variabele ‘land’, staat een ‘lege kolom’ genoteerd. Dit is niet toegestaan.
- in de tweede regel ziet u de eerste regel met waarden.
- in de derde regel ziet u de tweede regel met waarden. De waarde op de variabele opinie bestaat
uit meerdere regels. De regel voor deze persoon wordt afgesloten op regel 5. - in regel 6 ziet u hoe u een variabele ‘leeg’ kunt laten. Er staat niets ingevuld op de variabele opinie.
- in regel 7 lijkt een lege regel genoteerd te staan. Dit zorgt voor een error en moet voorkomen worden.
- geslacht;gebplaats;leeftijd;opinie;land;;
- v ;Amsterdam;56;”geen mening”;Nederland
- v;Alkmaar;30;”Hallo;
- ik vind het een goed idee.
- groeten”;Nederland
- m;Leiden;45;;Nederland
- ;;;;
- Numerieke waarden hebben de punt “.” als decimaal scheidingsteken en bevatten verder geen duizendtal scheidingstekens.
- Om uw gegevens goed te kunnen verwerken moet bekend zijn welke character encoding gebruikt wordt. Standaard wordt uitgegaan van UTF-8. Indien u gebruik wil maken van een andere character encoding format dient u dit kenbaar te maken, dit kan via onze servicedesk.