Datensatz

von Bertram Krumm

Fotograf: Steindy/Wikipedia

Auf Gegenstande, die als Daten bezeichnet werden oder die zumindest Daten enthalten, trit man im Alltagsleben gar nicht so selten. Arztbriefe enthalten Daten von Patienten. Wenn in der Mitgliederversammlung eines Vereins ein neuer Vorstand gewahlt wurde, dann ist das Protokoll dieser Versammlung ebenfalls datenhaltig. Das in der Abbildung enthaltene Foto einer Fußballmannschaft (eines Vereinsvorstands etc), dessen Legende die Namen der abgebildeten Spieler (Vorstände etc) enthalt, ist ein ganz klarer Fall. Laut Datenschutzgrundverordnung (DSGVO) geht es hier um personenbezogene Daten.

Gemeinsam ist Daten, dass sie Informationen uber Personen, Lebewesen, Gegenstande oder andere Objekte enthalten. Die Informationen beziehen sich auf Eigenschaften und Charakteristika der Objekte. Der aualligste Unterschied zwischen den eben beschriebenen Daten und Daten, die analysiert werden, ist die starkere Strukturiertheit der letzteren. Ihre starkere Strukturiertheit wird an zwei Stellen besonders deutlich sichtbar:

- Form der Datensatzes.

- Darstellung der Eigenschaften der Objekte.

Form der Daten: Daten, die analysiert werden, haben die Form einer rechteckigen Tabelle.

Es gilt

- Jedem Objekt ist eine Zeile zugeordnet. Alle Informationen uber das Objekt liegen in dieser Zeile.

- Jeder Eigenschaft der Objekte ist eine Spalte der Tabelle zugeordnet.

Darstellung der Eigenschaften: Die Zellen einer Datentabelle enthalten

- entweder die numerischen Werte von Eigenschaften

- oder alphanumerische Zeichen, die durch Einstufung im Wertebereich einer qualitativen Variablen zustande kommen.

Der Inhalt des zweiten Spiegelstrichs klingt ziemlich kryptisch. Daher ein Beispiel fur eine Datentabelle und fur den numerischen oder alphanumerischen Inhalt der Zellen (Tabelle 1).

Die Stadt Mannheim besteht aus 17 Stadtbezirken. Tabelle 1 enthalt in der ersten Spalte die Nummern der Stadtbezirke, die Spalten zwei und drei enthalten die Namen der Stadtbezirke und Anzahl der Einwohner. Ublicherweise stellt man der Datentabelle eine Zeile voran, die die Namen der Spalten (Variablenamen) enthalten. Die Datentabelle beginnt dann mit Zeile 1 und endet mit Zeile 17. Die Zellen der Spalten eins und drei enthalten Zahlen, also numerische Werte. Die Zahlen sind die numerischen Werte der Variablen "Nummer des Stadtteils" bzw "Anzahl der Einwohner". Spalte zwei enthalt die Namen der Stadtbezirke. Die Namen sind die (alphanumerischen) Werte der Variablen Stadtbezirk. In Mannheim hat diese Variable 17 mogliche Werte.

 

Zurück