Datentypen

Daten beschreiben Eigenschaften von Produkten, Prozessen oder Dienstleistungen. Diese Eigenschaften können in qualitative und quantitative Daten unterteilt werden. Zur datenbasierenden Analyse im Lean Six Sigma sollten die folgenden Datentypen und Verteilungen bekannt sein.

Zielsetzung
berg_glossar_zielsetzung

Vorgehensweise:

Bestimmen des Merkmals

Bestimmen Sie das Merkmal und die Merkmalsausprägungen. Z.B. Merkmal = Alter; Merkmalsausprägung = 42 Jahre.

Kategorisierung der Merkmalsausprägung

Die Merkmalsausprägungen müssen in eine Skala gesetzt werden, um den Datentyp zu definieren.

 

SkalaMerkmalausprägungenBeispiele
NominalRein qualitativ ohne OrdnungGeschlecht, Berufsstand, Farben
OrdinalQualitativ mit natürlicher OrdnungNoten, Rang beim Militär
MetrischQuantitativ (zählbar/messbar)10 Fehler, Luftdruck, Temperatur

Auswertung und Interpretation der Daten

Nach der Identifizierung der Daten können diese mit der Statistik ausgewertet werden.

Mit der folgenden Abbildung können die Datenkorrekt eingeordnet werden.
SPL Ablaufschema Datentypen

Verteilungen werden in der Statistik üblicherweise durch Funktionen beschrieben. Es existieren Modelle (Formen) für stetige und für diskrete Verteilungen.

Binomialverteilung

Die Binomialverteilung ist eine diskrete Verteilungen. Mit ihr kann man die Häufigkeit von Merkmalen, in zwei Ausprägungen darstellen. Z.B. Anzahl Fehler in einer Produktion.

Poissonverteilung

Die Poissonverteilung ist ein spezieller Fall der Binomialverteilung.
Mit ihr werden die Anzahl der Fehler pro Einheit beschrieben, die in einer Einheit vorkommen.

Hypergeometrische Verteilung

Die Hypergeometrische Verteilung wird verwendet, wenn die Stichproben aus kleinen Grundgesamtheiten ohne Zurücklegen gezogen werden. Ein Beispiel sind die Lottozahlen.

Normalverteilung

Die Normalverteilung ist die wichtigste Verteilungsfunktion für stetige Daten. Die meisten statistischen Verfahren basieren auf normalverteilten Daten.

Lognormalverteilung

Die Lognormalverteilung ist linkssteil und rechtsschief und nimmt keine Werte kleiner als 0 an. Sie wird häufig angewendet, um Prozesszeiten zu beschreiben.

Weibullverteilung

Die Weibullverteilung ist in ihrem Verlauf sehr flexibel. Über die Parameterwerte kann die Kurve an verschiedene Verläufe angepasst werden. Beispiele sind Lebensdaueranalysen.