100% unverbindliche Anfrage

Bitte wählen Sie:

CSV Datei Begriffserklärung und Definition

csv-dateiEine CSV Datei (englisch für comma-separated values) ist eine speziell aufgebaute Textdatei, mit der man einfach strukturierte Daten speichern und austauschen kann. Es können sowohl Listen als auch ganze Tabellen unterschiedlicher Länge gespeichert werden. Auch komplexere Datenstrukturen wie zum Beispiel geschachtelte Objekte können durch zusätzliche Regeln oder durch die Verkettung von mehreren CSV Dateien gespeichert werden. Dateien des systemunabhängigen CSV Formats enden typischerweise mit .csv und haben den MIME-Type text/csv. Sie können mit speziellen Programmen oder auch mit jedem beliebigen Texteditor geöffnet, geändert und gespeichert werden.

Für CSV existiert derzeit noch kein allgemeiner Standard. Mit dem RFC 4180 gibt es allerdings ein weit verbreitetes Dokument, welches sich in den nächsten Jahren zum Standard entwickeln könnte. Unabhängig von einer möglichen Standardisierung wird CSV aber heute schon sehr häufig eingesetzt und findet sich in vielen Anwendungen der Dateneingabe und -verarbeitung wieder. Problematisch sind lediglich nicht spezifizierte Datentypen, beliebig wählbare Separatoren und die fehlende Möglichkeit einen festen Zeichensatz anzugeben.

Aufbau einer CSV Datei

Eine CSV Datei besteht aus beliebig vielen Datensätzen. Einzelne Datensätze werden üblicherweise durch einen Zeilenumbruch voneinander getrennt. Dabei werden meistens je nach Betriebssystem, welches die Datei erzeugt, die für das Betriebssystem typische Zeichen für den Zeilenumbruch verwendet. Beim Wechsel des Betriebssystems kann es dadurch zu Formatierungsproblemen kommen. Der erste Datensatz kann ein spezieller Kopfdatensatz sein, der die Namen der Spalten definiert. Dies ist immer dann sinnvoll, wenn man nicht die Möglichkeit hat, den Inhalt einer CSV Datei an anderer Stelle ausführlich zu dokumentieren.

Jeder Datensatz besteht wiederum aus beliebig vielen Datenfeldern (Spalten). Allgemein werden diese durch ein Komma getrennt (daher der Name). Da kein allgemeiner Standard für das Dateiformat existiert, ist jedoch auch die Trennung mit jedem beliebigen anderen Zeichen denkbar. Häufig werden auch der Tabulator, Leerzeichen, Semikolon, Doppelpunkt oder andere Zeichen zur Trennung der Datensätze herangezogen.

Ein Trennzeichen sollte beim Erstellen immer so gewählt werden, dass es möglichst wenig in den eigentlichen Datensätzen vorkommt. Kommt das Trennzeichen in den Datensätzen vor, so müssen spezielle Feldbegrenzerzeichen (auch Textbegrenzungszeichen genannt) verwendet werden. Normalerweise handelt es sich dabei um das Anführungszeichen. Kommt der Feldbegrenzer selbst in den Daten vor, wird dieser im Datenfeld maskiert, in dem er doppelt geschrieben wird. Jeder Datensatz sollte wenn möglich immer die gleiche Anzahl Spalten enthalten.

Datenformate in CSV Dateien

Bei einer CSV Datei gibt es keine vorgegebenen Datenformate. Die Formatierung muss also von den beteiligten Benutzern abgestimmt werden. Zu Problemen kann es insbesondere bei Datums- und Zeitangaben kommen, da die Reihenfolge von Jahr, Monat, Tag, Stunde, Minute und Sekunde nicht immer eindeutig festgestellt werden kann. Außerdem werden Datumsangaben von Region zu Region unterschiedlich formatiert und es werden von Land zu Land verschiedene Trennzeichen verwendet.

Weitere Probleme treten bei der Verarbeitung von Sonderzeichen auf. Da in einer CSV Datei nirgendwo der verwendete Zeichensatz explizit angegeben wird, kann es zu Unstimmigkeiten beim Öffnen auf einem anderen System kommen. Häufig werden Umlaute nicht korrekt dargestellt. Viele Programme bieten aber an, den Zeichensatz manuell auszuwählen. Als kleinster gemeinsamer Nenner gilt der 7-Bit-ASCII, welches zwar eine sehr eingeschränkte Anzahl an Zeichen zur Verfügung stellt (zum Beispiel keine Umlaute und nur wenige Sonderzeichen), dafür aber von praktisch allen Programmen erzeugt und verarbeitet werden kann.

Problematisch kann auch die Verarbeitung des leeren Datenfelds sein. Dieses wird in einer CSV Datei durch zwei direkt aufeinander folgende Feldbegrenzer (meistens Anführungszeichen) erzeugt. Zwei aufeinanderfolgende Feldbegrenzerzeichen gelten aber auch als ein einzelnes maskiertes Feldbegrenzerzeichen. So wird manchmal anstatt eines leeren Datenfeldes ein Zeichen interpretiert. Während diese mögliche Fehlerquelle im privaten Bereich nicht so stark ins Gewicht fällt, kann es bei professionellen Datenbankanwendungen schlecht sein, wenn ein Datenfeld nicht korrekt als leer erkannt wird.

Anwendung von CSV

Das CSV Format wird in vielen verschiedenen Bereichen verwendet. Es bietet sich immer dann an, wenn ein Programm oder Service einfach strukturierte Daten wie zum Beispiel Tabellen zum Download anbieten möchte. Softwareentwickler können dann zum Beispiel Programme schreiben, die die CSV Dateien einlesen und in eine Datenbank abspeichern. Vielen Datenbankmanagement Systeme unterstützen CSV sowohl als Import- als auch Exportformat. Aber auch Endanwender können CSV Dateien mit Hilfe von kostenpflichtigen oder freien Programmen für die Tabellenkalkulation anwenden und weiterverarbeiten. Da es beim CSV Dateiformat aber um nichts anderes handelt als um Textdateien, können CSV Dateien auch mit jedem Texteditor geöffnet und erstellt werden.

Generell wird CSV oft dann eingesetzt, wenn Dateien wie zum Beispiel Datenbanktabellen zwischen unterschiedlichen Computerprogrammen ausgetauscht werden sollen. Open Data Projekte stellen ihre Daten häufig in diesem Format zur Verfügung, da es unabhängig von speziellen Datenbanksystemen ist. Immer gilt bei CSV, dass sowohl der Ersteller als auch der Nutzer der Datei seine verwendeten Programme jederzeit selbständig ändern kann. Die Daten in der CSV Datei bleiben dabei gleich und können auch vom neuen Programm erzeugt beziehungsweise verarbeitet werden. Daher bietet es sich auch an auf CSV zu setzen, wenn man von einem Tabellenkalkulationsprogramm zu einer anderen Version oder einem anderen Anbieter wechseln möchte.



Zurück zur Hauptseite: c

Sie haben Fragen?

Kostenlose, unverbindliche Erstberatung:

Anrufer aus Deutschland:
Tel. 0771 - 1589439
Internationale Beratung:
Tel. +49771 - 1589439
Anfrage per Email:
buero@seo-analyse.com

» zum Anfrage-Formular

Onpage Optimierung

Suchmaschinenoptimierung im Quelltext

Wir schaffen für Ihre Webseite oder Ihren Shop eine optimale Onpage-Basis für weiterführende Optimierungsmaßnahmen.

Offpage Optimierung

Offpage Suchmaschinenoptimierung

Natürlicher Linkaufbau gemäß den Regeln der Suchmaschinen - wir bieten ihn!

SEO Beratung

SEO Beratung

Unsere Spezialisten beraten Sie gerne hinsichtlich Ihrer akuten oder strategischen Fragen.

Ranking Monitoring

Ranking Optimierung

Bei uns Standard: qualifiziertes Monitoring Ihrer Google Platzierungen.

Suchmaschinenoptimierung für Google

Google Suchmaschinenoptimierung

Wir kombinieren Google Optimierung mit ganzheitlicher Suchmaschinenoptimierung.

SEO Strategie

SEO Strategie

Praxisbewährte Strategien, die auf Zahlen und Fakten basieren.

SEO Tools

SEO Tools

Immer im Bild: professionelle SEO Tools informieren Sie über den Status Quo.