1 besc hreib ende und explorativ e statistik - web4.wzw.tum.de · 1.1 besc hreibung...

66

Upload: others

Post on 05-Sep-2019

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1 Beschreibende und explorative Statistik

Die beschreibende oder deskriptive Statistik und die explorative Statistik be-trachten eine vorliegende Menge von Objekten, von denen f�ur jedes Objekt ein Merk-mal oder mehrere Merkmale beobachtet oder gemessen wurden. Um Ordnung in einesolche Datenmenge zu bringen, kann man z.B. ausz�ahlen, wie oft die einzelnen Merk-malsauspr�agungen vorkommen oder wie oft diese in ein bestimmtes Intervall fallen.Die graphische Darstellung der Ergebnisse f�uhrt zur sog. empirischen H�au�gkeits-

verteilung der gegebenen Datenmenge. Diese Verteilung gibt das Datenmaterial in

�ubersichtlich aufbereiteter Form wieder. Die Gewinnung einer solchen Verteilung stellteine Hauptaufgabe der beschreibenden Statistik dar.

W�ahrend eine H�au�gkeitsverteilung die wesentliche Information, die in einer Daten-menge steckt, nahezu unver�andert enth�alt, geben statistische Ma�zahlen, wie z.B.Mit-

telwert und Streuung stellvertretend f�ur die ganze Menge von Einzelwerten jeweilseine einzige Zahl als Parameter an.

Neben den empirischen H�au�gkeitsverteilungen und entsprechenden Ma�zahlen werdensp�ater die theoretischen Verteilungen und analoge Ma�zahlen vorgestellt. Sie dienen zurAngabe der Wahrscheinlichkeit f�ur das Eintre�en bestimmter zuf�alliger Ereignisse.

1.1 Beschreibung eindimensionaler Stichproben

Wird f�ur jedes Objekt einer Menge lediglich ein Merkmal beobachtet oder gemessen,so ist die entsprechende H�au�gkeitsverteilung dieses Merkmals eine eindimensionale

H�au�gkeitsverteilung. Bestimmt man z.B. bei einer Anzahl von Autos die Koh-lenmonoxidkonzentration der Abgase, so ist die zugeh�orige Verteilung des Merkmals\Kohlenmonoxid\ eindimensional. Eine zus�atzliche Messung der Stickoxidkonzentrati-on f�uhrt zu zwei Me�werten pro Auto. Dieses Zahlenmaterial kann in einer zweidi-mensionalen H�au�gkeitsverteilung zusammengefa�t werden (Abschnitt 1.3).

1.1.1 Stichprobe und Grundgesamtheit

Das Ergebnis einer statistischen Erhebung liegt in der Regel zun�achst in Form einerUrliste vor. Darunter versteht man ein Protokoll, auf dem die beobachteten Werte inder Reihenfolge stehen, wie sie beobachtet und notiert wurden.

Wird z.B. eine gewisse Anzahl von Studenten der Technischen Universit�at M�unchen-Weihenstephan zuf�allig ausgew�ahlt und ihre Gr�o�e bestimmt, so erhebt man eine Stich-probe �uber die K�orpergr�o�e der Studenten. Die notierten Me�werte in der Urliste, alsodie Gr�o�e der ausgew�ahlten Studenten, sind die Stichprobenwerte.

Eine zuf�allige Teilmenge aus einer Menge von beliebigen Objekten (Personen, Tiere,Gegenst�ande usw.), die sich durch ein oder mehrere gemeinsame Merkmale auszeich-nen, hei�t eine Stichprobe. Umfa�t diese Teilmenge genau n Objekte, so spricht manvon einer Stichprobe vom Umfang n. Wenn zuk�unftig von Stichproben die Rede ist,dann ist damit meistens die Stichprobe der Merkmalswerte und weniger die der Objekte

Page 2: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

6 1 Beschreibende und explorative Statistik

gemeint. Die Grundgesamtheit ist die Menge aller m�oglichen oder denkbaren Objek-te, die sich durch die gleiche Eigent�umlichkeit auszeichnen, z.B. die Grundgesamtheitaller Weihenstephaner Studenten.

Aus �okonomischen, zeitlichen oder praktischen Gr�unden arbeitet man fast ausschlie�-lich mit Stichprobenerhebungen und nur in Ausnahmef�allen mit Vollerhebungen,d.h. mit einer Erhebung der ganzen Grundgesamtheit. Es ist z.B. praktisch ausge-schlossen, alle Weihenstephaner Studenten zu vermessen, da immer ein Teil davonim Praktikum ist. Eine ann�ahernd vollst�andige Vollerhebung liegt beispielsweise beiVolksz�ahlungen vor, die mit einem erheblichen Finanz- und Arbeitsaufwand durch-gef�uhrt werden. Ziel einer Stichprobenerhebung ist also, aufgrund einer Stichproberealistische Aussagen �uber die Grundgesamtheit zu machen, also beispielsweise die un-bekannte tats�achliche K�orpergr�o�enverteilung der Studenten durch die Verteilung derStichprobenwerte abzusch�atzen.

Eine gegebene Datenmenge soll im folgenden als eine Stichprobe aus einer Grundge-samtheit angesehen werden. Die Aufgabe der beschreibenden Statistik ist, die in einerUrliste gegebene Menge von Daten zu ordnen, �ubersichtlich darzustellen und mit sta-tistischen Ma�zahlen zu kennzeichnen, um einen �Uberblick �uber die Verteilung derMerkmalswerte zu bekommen.

Beispiele:

1. Tab. 1.1 zeigt die Urliste einer Stichprobe von 100 Jungsauen, bei denen das Merk-mal \Anzahl der Ferkel pro Wurf\ betrachtet wurde. Es liegt eine eindimensionaleStichprobe vor, denn f�ur jedes Element, also f�ur jede Sau, wurde ein Merkmalswertgemessen.

11 13 7 15 6 11 8 7 4 129 14 11 10 10 8 14 7 12 109 12 6 7 8 12 9 10 7 913 10 8 10 12 11 9 8 6 109 13 14 9 11 9 11 10 11 712 10 12 11 9 11 9 10 12 816 11 9 10 11 9 12 10 13 1110 7 9 11 10 9 11 10 14 87 9 10 9 10 11 8 13 9 1012 8 12 11 10 7 15 9 10 8

Tabelle 1.1: Urliste �uber die Anzahl der Ferkel pro Wurf bei einer Stichprobe vonn = 100 Jungsauen

Page 3: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.1 Beschreibung eindimensionaler Stichproben 7

2. Eine zweidimensionale Stichprobe vom Umfang n = 20 erh�alt man beispielsweise,wenn man bei 20 zuf�allig ausgew�ahlten Rindern jeweils zwei Merkmale mi�t. InTabelle 1.2 ist der Brustumfang und die Kreuzh�ohe von 20 Rindern festgehalten.

Tier Brustum- Kreuz-Nr: fang [cm] h�ohe [cm]

1 180 1212 168 1163 170 1144 167 1165 177 1196 164 1157 180 1218 169 1209 164 11210 180 117

Tier Brustum- Kreuz-Nr: fang [cm] h�ohe [cm]

11 170 12312 170 11813 175 11514 172 11715 175 11916 172 12317 171 11418 167 11719 168 11520 155 115

Tabelle 1.2: Brustumfang und Kreuzh�ohe bei 20 Rindern

3. Allgemein erh�alt man eine m-dimensionale Stichprobe vom Umfang n, wenn anjedem der n Elemente jeweils m Merkmale (x1; x2; : : : ; xm) gemessen werden. Tab.1.3 enth�alt eine f�unfdimensionale Stichprobe vom Umfang n = 10.

28 Tage- Alter bei t�agliche Stallend- Schlacht-Nr: Gewicht Mastende Zunahme gewicht gewicht

[kg] [Tage] [g] [kg] [kg]

1 8:3 179 745 98 76:52 9:5 164 814 103 78:53 9:2 166 778 102 76:04 10:7 166 761 102 78:55 9:6 175 761 101 78:56 8:4 186 700 98 75:07 9:1 178 745 98 76:58 10:2 183 707 100 76:09 7:5 184 778 103 80:010 7:3 197 700 97 70:0

Tabelle 1.3: Schweinedaten �uber f�unf verschiedene Merkmale der Mastleistung

Page 4: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

8 1 Beschreibende und explorative Statistik

1.1.2 Einteilung der Merkmale

Bei Merkmalen einer Stichprobe wird zun�achst zwischen quantitativen, d.h. zah-lenm�a�ig erfa�baren und qualitativen, d.h. artm�a�ig erfa�baren Merkmalen unter-schieden.

Beispiele f�ur qualitative Merkmale sind Geschlecht, Farbe, Schadens- oder Handelsklas-se, Sorte, Beruf usw. Eine genauere Einteilung der qualitativen Merkmale unterscheidetordinal und nominal erfa�bare Merkmale.

Bei einem ordinalen Merkmal kann man die einzelnen Auspr�agungen nicht mehrmessen im �ublichen Sinne, wohl aber noch in eine Reihenfolge bringen oder ordnen. Einsolches Stichprobenelement besitzt jeweils einen Rang 1, Rang 2, Rang 3 usw., das hei�taber nicht, da� mittels dieser Rangzahlen ein echtes quantitatives metrisches Merkmalvorliegt. Mit einer solchen Rangskala kann man zwar eine Rangordnung konstatieren,aber nicht sagen, der Abstand zwischen Rang 1 und Rang 3 ist zweimal so gro� wiezwischen Rang 1 und Rang 2.

Bei einem nominalen Merkmal kann man nur noch die einzelnen Auspr�agungen desMerkmals feststellen und willk�urlich nebeneinander aufreihen, ohne eine Abstufungdurchzuf�uhren oder eine Angabe �uber Abst�ande zu machen.

Beispiele f�ur ordinale Merkmale sind Schadens- oder Handelsklassen, Schulnoten, An-gaben �uber die Befallsh�au�gkeit einer bestimmten Krankheit bei P anzen oder dieStadien eines Tumors. Beispiele f�ur nominale Merkmale sind Konfession, Farbe, Ge-schlecht, Sorte oder Beruf.

Quantitative odermetrischeMerkmale k�onnen durch einen Me�- oder Z�ahlvorgangerfa�t werden. Beispiele daf�ur sind K�orpergr�o�e, Gewicht, Ferkel- oder Kinderzahl, Ein-kommen. Quantitative Merkmale unterteilt man dar�uberhinaus in diskrete und stetigeMerkmale.

Stetige Merkmale k�onnen jeden beliebigen Wert innerhalb eines gewissen Intervallsannehmen, z.B. die K�orpergr�o�e oder das K�orpergewicht.Diskrete Merkmale habennur ganz bestimmte Auspr�agungen, die man abz�ahlen kann, wie z.B. Ferkel- und Kin-derzahl oder die Anzahl der Bl�atter bei P anzen. Die Merkmalsauspr�agungen diskreterMerkmale sind also ganze, meist nichtnegative Zahlen.

Eine zweite Art der Unterteilung der quantitativen Merkmale di�erenziert, ob Merk-male mit einer Intervall- oder mit einer Verh�altnisskala erfa�t werden.

Bei einer Intervallskala ist charakteristisch, da� die Erfassung des Abstands, d.h.

Bildung der Di�erenz zwischen zwei Merkmalsauspr�agungen, m�oglich ist. Beispiel daf�urist die Temperaturmessung in Grad Celsius oder Fahrenheit.

Bei einer Verh�altnisskala hat man zus�atzlich einen wahren, absoluten Nullpunkt, aufden die einzelnen Merkmalsauspr�agungen bezogen werden k�onnen. Beispiele sind dieTemperaturmessung in Grad Kelvin, die L�angen-, Gewichts- und Zeitmessung.

Der �Ubergang zwischen diskreten und stetigen Merkmalen ist zum Teil ie�end. Wennman die L�ange eines Werkst�ucks, die ein stetiges Merkmal darstellt, auf volle Zenti-meter abrundet, so nimmt dieses Merkmal den Charakter eines diskreten Merkmalsan. Au�erdem kann man jedes stetige Merkmal gruppieren und erh�alt so ein diskretesMerkmal.

Page 5: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.1 Beschreibung eindimensionaler Stichproben 9

Eine zusammenfassende �Ubersicht der Merkmalseinteilung mit Beispielen enth�alt Tab.1.4.

qualitativ quantitativ (metrisch)

artm�a�ig zahlenm�a�ig

nominal ordinal diskret stetig

Auspr�agungen Rangfolge ganzzahlig beliebig

Religion Handelsklassen Kinder GewichtGeschlecht Schulnoten P anzen ZeitArt Schadensstufen Tiere Sto�gehalt

Typ Merkmal

qualitativ nominal Baumart Tanne, Fichte, Kiefer,Buche, Eiche

ordinal Sch�adigung ohne, schwach, mittel,stark, tot

quantitativ diskret Rehe/ha 0� 20stetig Bleigehalt 0:0� 100:0 ppm

Tabelle 1.4: Einteilung der Merkmale

1.1.3 H�au�gkeitsverteilungen bei diskreten Merkmalen

Betrachtet wird das Merkmal \Anzahl der Ferkel pro Wurf\ in Tab. 1.1 auf Seite 6.Dieses Merkmal nimmt nur ganze Zahlen gr�o�er oder gleich Null als Werte an undstellt damit ein diskretes Merkmal dar.

Wenn man ausz�ahlt, wie oft die verschiedenen Ferkelzahlen vorkommen, erh�alt mandie H�au�gkeitstabelle, bzw. Verteilung der Merkmalswerte in Tab. 1.5.

Ferkel pro Wurf 4 5 6 7 8 9 10 11 12 13 14 15 16

H�au�gkeit 1 0 3 9 10 18 20 16 11 5 4 2 1

Tabelle 1.5: H�au�gkeitstabelle f�ur die Ferkelzahlen von Tab. 1.1

Beim Ausz�ahlen der Urliste kann man sich mit einer Strichliste behelfen. In der Strich-liste geben die Summen der einzelnen Striche in einer Zeile die absolute H�au�gkeitni f�ur den i-ten Merkmalswert xi an (Tab. 1.6).

Auf kariertem Papier kann man ebenfalls bequem eine Urliste ausz�ahlen, indem man

�uber dem entsprechenden Merkmalswert ein Kreuz malt (Bild 1.1). Die Summe derKreuze �uber einem Merkmalswert ist die absolute H�au�gkeit ni.

Wenn man die absoluten H�au�gkeiten auf den Umfang n der Stichprobe bezieht, erh�altman die relativen H�au�gkeiten hi f�ur die Merkmalswerte xi.

Page 6: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

10 1 Beschreibende und explorative Statistik

4 j56 jjj7 jjjj jjjj8 jjjj jjjj9 jjjj jjjj jjjj jjj10 jjjj jjjj jjjj jjjj11 jjjj jjjj jjjj j12 jjjj jjjj j13 jjjj14 jjjj15 jj16 j

Tabelle 1.6: Strichliste der Ferkelzahlen von Tab. 1.1

0

5

10

15

20

absolute Häufigkeit

0 2 4 6 8 10 12 14 16 18 20 Ferkel

Bild 1.1: Kreuztabelle der Ferkelzahlen aus Tabelle 1.1

Sei mit h(xi) = hi die relative H�au�gkeit f�ur den Merkmalswert xi bezeichnet. Danngilt:

hi = h(xi) =Anzahl der Stichprobenwerte mit xi als Ergebnis

Stichprobenumfang n(1.1)

Im Beispiel hat die Wurfzahl 8 die H�au�gkeit h8 = h(8) = 10=100 = 0:10 oder auch10%. Es ist klar, da� die relative H�au�gkeit einer Merkmalsauspr�agung (hier: einerWurfzahl) zwischen 0 und 1 liegt bzw. zwischen 0% und 100%, die beiden Zahlenjeweils eingeschlossen. Es gilt also: 0 � hi � 1.

Tab.1.7 zeigt die absoluten und relativen H�au�gkeiten der Ferkelzahlen aus Tab. 1.1.

Page 7: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.1 Beschreibung eindimensionaler Stichproben 11

Ferkel pro Wurf absolute H�au�gkeit relative H�au�gkeit

4 1 0:015 0 0:006 3 0:037 9 0:098 10 0:109 18 0:1810 20 0:2011 16 0:1612 11 0:1113 5 0:0514 4 0:0415 2 0:0216 1 0:01

Summe 100 1:00

Tabelle 1.7: H�au�gkeitstabelle der Ferkelzahlen von Tabelle 1.1

1.1.4 H�au�gkeitsfunktion einer Stichprobe

Einer Stichprobe vom Umfang n mit m verschiedenen Werten x1; x2; : : : ; xm kann maneine Funktion ef(x), die sog. H�au�gkeitsfunktion, zuordnen. Wenn hi die relativeH�au�gkeit h(xi) f�ur i = 1; 2; : : : ;m bezeichnet, so erfolgt die Zuordnung:

ef(x) = � hi f�ur x = xi (i = 1; 2; : : : ;m)0 sonst

(1.2)

Die Funktion ef(x) nimmt also an den m Stellen xi (i = 1; 2; : : : ;m) die Werte hi anund ist sonst �uberall gleich Null (vgl. Bild 1.2).

0 2 4 6 8 10 12 14 16 Ferkel0.00

f~

0.04

0.08

0.02

0.06

0.100.120.140.16

0.180.20

Bild 1.2: H�au�gkeitsfunktion ef(x) der Ferkelzahlen aus Tabelle 1.1

Man verwendet jedoch als graphische Darstellung meist ein Balken-, S�aulendia-gramm oder Histogramm. Dies ist eine optisch etwas ansprechendere graphische

Page 8: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

12 1 Beschreibende und explorative Statistik

Form der H�au�gkeitsfunktion ef(x). Man zeichnet einfach eine S�aule bzw. einen Bal-ken �uber den Stichprobenwert dessen H�ohe der absoluten oder relativen H�au�gkeit desStichprobenwerts entspricht. Man erh�alt dann eine Auftragung wie in Bild 1.3, in derdie absoluten H�au�gkeiten als Balken dargestellt sind.

0 2 4 6 8 10 12 14 16 Ferkel0.00

f~

0.04

0.08

0.02

0.06

0.100.120.140.16

0.180.20

AAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAA

Bild 1.3: Histogramm der Ferkelzahlen aus Tabelle 1.1

Wenn man die Punkte der H�au�gkeitsfunktion bzw. die Mitten der S�aulen beim Balken-diagramm durch Geradenst�ucke miteinander verbindet, erh�alt man ein sog. H�au�g-keitspolygon. Das kann n�utzlich sein, um z.B. die zeitliche Entwicklung eines Merk-mals deutlich zu machen.

1.1.5 H�au�gkeitsverteilungen bei stetigen Merkmalen

Hat eine Stichprobe einen sehr gro�en Umfang und kommen viele zahlenm�a�ig ver-schiedene Werte vor, so ist die Zeichnung der H�au�gkeitsfunktion wenig �ubersichtlich.Auch wenn die Stichprobenwerte keine ganzen Zahlen sind, wie im Beispiel mit derAnzahl der Ferkel, sondern Zahlen aus einem gewissen Intervall, wenn z.B. ein Ertrag,ein Gewicht oder eine L�ange gemessen werden, ist eine Klassenbildung sinnvoll.

Das Intervall, in dem alle vorkommenden Stichprobenwerte liegen, wird in eine zweck-m�a�ige Anzahl von Teilintervallen oder Klassenintervallen unterteilt. Es ist dabeioft n�utzlich, da� alle Klassen gleich gro� sind, also konstante Klassenbreite haben. EineKlasse wird entweder mit Hilfe der unteren (linken) und oberen (rechten) Klassengrenzeoder mit der Klassenmitte und Klassenbreite festgelegt.

Die Anzahl von Stichprobenwerten, die in eine bestimmte Klasse fallen, hei�t abso-lute Klassenh�au�gkeit dieser Klasse. Die relative Klassenh�au�gkeit erh�alt mannach Division der absoluten Klassenh�au�gkeit durch den Stichprobenumfang. Vor derZuordnung der Stichprobenwerte zu den einzelnen Klassen legt man eine sich nicht

�uberlappende Klassenteilung fest, so da� die Zuordnung der Stichprobenwerte zu deneinzelnen Klassen eindeutig ist.

Man w�ahlt au�erdem entweder die Klassenmitten oder die Klassenenden so, da� siem�oglichst einfachen Zahlen entsprechen. Bei der Klassenbildung geht nat�urlich Infor-mation verloren. Die Menge aller Stichprobenwerte wird reduziert auf die H�au�gkeitenin den einzelnen Klassen.

Page 9: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.1 Beschreibung eindimensionaler Stichproben 13

Will man nachtr�aglich aufgrund einer Klassi�zierung den arithmetischen Mittelwert x(vgl. Kap. 1.2) berechnen bzw. sch�atzen, so nimmt man zweckm�a�igerweise an, da� alleWerte in einer Klasse auf der Klassenmitte liegen. Der Fehler, den man dabei macht,ist umso kleiner, je gleichm�a�iger sich die Merkmalswerte �uber das ganze Intervallverteilen.

Man sollte generell nicht \zu klein\ klassi�zieren, weil dabei noch \zuviel\ Informationaus der Urliste �ubrig bleibt. Andererseits sollte auch nicht \zu gro�\ klassi�ziert werden,da in diesem Fall \zuviel\ Information �uber die H�au�gkeitsverteilung der Stichprobeverloren geht. Als Faustregel gilt: Die Anzahl der Klassen sollte kleiner oder h�ochstensgleich der Wurzel aus der Anzahl der Stichprobenwerte sein (

pn), wobei jedoch minde-

stens 5 und h�ochstens 25 Klassen vorkommen sollen. Au�erdem sollten m�oglichst keineleeren Klassen auftreten. Die H�au�gkeit in Abh�angigkeit von den Klassenmitten hei�tdie H�au�gkeitsfunktion der klassi�zierten Stichprobe.

Tab. 1.8 zeigt die Urliste der j�ahrlichen Milchleistung einer Stichprobe von 100 K�uhen.Es liegt eine eindimensionale Stichprobe vor, denn f�ur jedes Element, also f�ur jede Kuh,wurde ein Merkmalswert gemessen.

5614 5662 4344 5268 4629 4273 5754 5197 5448 45525866 5601 6799 4834 4113 5548 3760 4599 5560 56503952 5952 4951 4875 3702 5262 4986 6352 5614 55775626 6627 5884 5908 6532 4201 4593 5770 4702 44915170 5142 5250 5329 4891 5055 5659 5292 5542 56624870 4935 5700 5397 5296 4689 5899 5155 5580 58516270 4908 5046 6505 4555 3867 4305 4660 4947 45045566 5436 4254 5569 5611 4618 6235 5065 5242 56085049 5067 4558 5613 5898 4611 4593 5259 5059 49335358 4938 5875 5626 3916 4381 5221 4999 4318 5832

Tabelle 1.8: Milchleistung von 100 Milchk�uhen in kg/a

Es liegt ein stetiges Merkmal vor, auch wenn die Me�werte auf ganze Kilogramm ge-rundet sind. Die meisten Werte kommen nur einmal vor. Aus diesem Grund nimmtman eine Klasseneinteilung vor und z�ahlt, wieviele Messungen in eine bestimmte Klas-se fallen. In Tab. 1.9 wurde eine konstante Klassenbreite von 400 kg=a festgelegt. Dieuntere Grenze der am weitesten links liegenden Klasse (sog. Reduktionslage) wurdeauf 3600 kg=a gesetzt, so da� man wie folgt klassi�zieren kann:

1. Klasse: [3600 : : :4000), 2. Klasse: [4000 : : :4400), usw.

Die vorletzte Spalte von Tab. 1.9 zeigt die absolute H�au�gkeitsverteilung, die letzteSpalte die relative H�au�gkeitsverteilung dieser Stichprobe.

Graphisch stellt man meistens die H�au�gkeitsverteilung einer klassi�zierten Stichpro-be in Form eines Histogramms oder Treppenpolygons dar. Man repr�asentiert dieH�au�gkeit der einzelnen Klassen durch Rechtecke, deren Fl�achen �uber den verschiede-nen Intervallen den H�au�gkeiten in diesen Intervallen proportional sind. Dieses Prinzipder Fl�achentreue sollte man insbesondere beachten, wenn man verschiedene Klassen-breiten w�ahlt. Wenn man eine konstante Klassenbreite (xi � xi�1) = �x gew�ahlt hat,

Page 10: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

14 1 Beschreibende und explorative Statistik

Klassen- Klassen- Absolute Klassenh�au�gkeit Relative Klassen-intervall mitte Strichliste n h�au�gkeit h

3600 : : :4000 3800 jjjj 5 0:054000 : : :4400 4200 jjjj jjj 8 0:084400 : : :4800 4600 jjjj jjjj jjjj 14 0:144800 : : :5200 5000 jjjj jjjj jjjj jjjj jj 22 0:225200 : : :5600 5400 jjjj jjjj jjjj jjjj 20 0:205600 : : :6000 5800 jjjj jjjj jjjj jjjj jjjj 24 0:246000 : : :6400 6200 jjj 3 0:036400 : : :6800 6600 jjjj 4 0:04

100 1:00

Tabelle 1.9: H�au�gkeitsverteilung zur Stichprobe aus Tabelle 1.8

braucht man nur die H�ohe der einzelnen Rechtecke proportional zur H�au�gkeit hi zuzeichnen.

Das Histogramm zur Verteilungstafel in Tab. 1.9 ist in Bild 1.4.a wiedergegeben. AlsOrdinate ist dort die relative H�au�gkeit ef(x) in Prozent aufgetragen. Man kann jedochgenauso gut die absoluten H�au�gkeiten darstellen.

680064006000560052004800440040003600

30

25

20

15

10

5

0

Milchleistung [kg/a]

rela

tive

Häu

figke

it [%

]

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

a)

690065006100570053004900450041003700

30

25

20

15

10

5

0

Milchleistung [kg/a]

rela

tive

Häu

figke

it [%

]

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

b)

70006500600055005000450040003500

35

30

25

20

15

10

5

0

Milchleistung [kg/a]

rela

tive

Häu

figke

it [%

]

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAA

c)

70006000500040003000

60

50

40

30

20

10

0

Milchleistung [kg/a]

rela

tive

Häu

figke

it [%

]

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAA

d)

Bild 1.4: Histogramme zur Stichprobe aus Tab. 1.8

Page 11: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.1 Beschreibung eindimensionaler Stichproben 15

Das Histogramm einer Stichprobe h�angt von der Festlegung der Klassenbreite und derReduktionslage ab. F�ur das Beispiel der Milchleistungsstichprobe wurden in Bild 1.4verschiedene Reduktionslagen und Klassenbreiten gew�ahlt. Wenn man die Reduktions-lage von 3600 kg=a (Bild 1.4.a) auf 3700 kg=a erh�oht (Bild 1.4.b), dann verschwindetder bei 5200 kg=a zu beobachtende sog. R�uckschlag, d.h. ein Abfall und anschlie-�ender Anstieg der H�au�gkeiten. Bild 1.4.c zeigt ein Histogramm mit sieben Klassen.In Bild 1.4.d mit einer Klassenbreite von 1000 kg=a sind nur vier Klassen besetzt.Diese Art der Darstellung ist aufgrund einer zu geringen Anzahl von Klassen f�ur eineH�au�gkeitsverteilung ungeeignet.

1.1.6 Summenh�au�gkeitsfunktion einer Stichprobe

Die Stichprobe ist nicht in Klassen eingeteilt

Will ein Tierz�uchter bei der Stichprobe �uber die Ferkelzahl von 100 Jungsauen wissen,wieviel Prozent der Tiere Ferkelzahlen von 10 oder weniger aufweisen, so kann er dasaus der H�au�gkeitstabelle 1.7 bzw. aus der H�au�gkeitsfunktion nicht sofort entnehmen.Er mu� die H�au�gkeiten f�ur die Ferkelzahlen 4; 5; : : : ; 10 aufsummieren:

0:01 + 0:00 + 0:03 + 0:09 + 0:10 + 0:18 + 0:20 = 0:61

61% der Tiere dieser Stichprobe haben also Ferkelzahlen von 10 oder weniger. Mankann nun f�ur jede in Tab. 1.7 vorkommende Ferkelzahl xi fragen, wieviel Prozent derTiere weisen Ferkelzahlen von xi oder weniger auf und die entsprechenden relativenSummenh�au�gkeiten berechnen. Damit hat man die Summenh�au�gkeitsfunkti-

on oder die empirische Verteilungsfunktion eF (x) der Stichprobe gewonnen.Die Summenh�au�gkeitsfunktion eF (x) einer diskreten Stichprobe ist also gleich derSumme der relativen H�au�gkeiten aller Stichprobenwerte t, die kleiner als x oder gleichx sind.

Tabelle 1.10 zeigt die Berechnung der Summenh�au�gkeitsfunktion f�ur die Ferkelzahlenvon Tab. 1.1.

Als Formel geschrieben lautet die De�nition der Summenh�au�gkeitsfunktion:

eF (x) =Xt�x

ef(t) (1.3)

Bild 1.5 enth�alt die graphische Darstellung der Summenh�au�gkeitsfunktion (1.3) f�urdie Ferkelzahlen von Tab. 1.1.

Die Stichprobe ist in Klassen eingeteilt

In diesem Fall mu� man die De�nition der Summenh�au�gkeitsfunktion etwas modi-�zieren. In einer Klasse sind genau so viele Werte enthalten wie der absoluten Klas-senh�au�gkeit entspricht.

Die Summenh�au�gkeitsfunktion an der Stelle x soll nach der bisherigen Au�assung an-geben, wieviele Werte kleiner oder gleich x sind. Bei einer klassi�zierten Stichprobe l�a�t

Page 12: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

16 1 Beschreibende und explorative Statistik

Anzahl der Fer- relative H�au- relative Summen-

kel pro Wurf xi �gkeit ef(xi) h�au�gkeit eF (xi)4 0:01 0:015 0:00 0:016 0:03 0:047 0:09 0:138 0:10 0:239 0:18 0:4110 0:20 0:6111 0:16 0:7712 0:11 0:8813 0:05 0:9314 0:04 0:9715 0:02 0:9916 0:01 1:00

Tabelle 1.10: Relative Summenh�au�gkeit der Ferkelzahlen aus Tab. 1.1

0 2 4 6 8 10 12 14 16 Ferkel

F~

0.0

0.2

0.4

0.6

0.8

1.0

0 2 4 6 8 10 12 14 16 Ferkel0.0

f~

0.1

0.2

Bild 1.5: H�au�gkeits- und Summenh�au�gkeitsfunktion der Stichprobe aus Tabelle 1.1

sich diese De�nition nicht exakt anwenden, weil die Werte in einer Klasse zusammen-gefa�t wurden und eine Zuordnung zu den x-Werten des Klassenintervalls nicht mehrm�oglich ist. Die beste M�oglichkeit ist, die Stichprobenwerte gedanklich in einer Klassegleichm�a�ig �uber die Intervallbreite zu verteilen. Man kann dann die Summenh�au�g-keitsfunktion als Polygonkurve zeichnen. eF (x) verl�auft dabei in jedem Klassenintervallals Geradenst�uckchen, welches jeweils vom linken bis zum rechten Klassenende um

Page 13: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.1 Beschreibung eindimensionaler Stichproben 17

die betre�ende Klassenh�au�gkeit ansteigt. Diese Version der Summenh�au�gkeitsfunk-tion l�a�t sich in vielen F�allen sinnvoll anwenden. Als Beispiel dient noch einmal dieStichprobe aus Tab. 1.8 (siehe Tab. 1.11).

Klassen relative Klassen- relative Summen-

h�au�gkeit ef(x) h�au�gkeit eF (x): : : 3600 0:00 0:00

3600 : : :4000 0:05 0:00 : : :0:054000 : : :4400 0:08 0:05 : : :0:134400 : : :4800 0:14 0:13 : : :0:274800 : : :5200 0:22 0:27 : : :0:495200 : : :5600 0:20 0:49 : : :0:695600 : : :6000 0:24 0:69 : : :0:936000 : : :6400 0:03 0:93 : : :0:966400 : : :6800 0:04 0:96 : : :1:006800 : : : 0:00 1:00

Tabelle 1.11: Relative Summenh�au�gkeit der Stichprobe von Tab. 1.8

Bild 1.6 zeigt die zugeh�orige Summenh�au�gkeitsfunktion.

3600 4000 4400 4800 5200 5600 6000 6400 6800

F~

0.0

0.2

0.4

0.6

0.8

1.0

0.0

f~

0.1

0.2

kg/a

3600 4000 4400 4800 5200 5600 6000 6400 6800 kg/a

0.3

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAA

Bild 1.6: Histogramm und Summenh�au�gkeitsfunktion der Stichprobe aus Tabelle 1.8

Page 14: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

18 1 Beschreibende und explorative Statistik

1.1.7 Streudiagramme und Punkteplots

Eindimensionale Streudiagramme oder Scatter Plots stellen alle Einzelwerte

�uber einem Zahlenstrahl dar. Sie sind besonders f�ur stetige Merkmale geeignet. Bild1.7 zeigt das Streudiagramm f�ur die Milchleistungen aus Tab. 1.8.

Bild 1.7: Streudiagramm der Milchleistung aus Tabelle 1.8

Das Merkmal Ferkelzahl ist diskret. Infolgedessen werden im Streudiagramm gleicheWerte mehrmals �ubereinander gezeichnet. Besser ist in diesem Fall ein Punkteplot

oderDotplot, bei dem gleiche gro�eWerte als Punkte �ubereinander gezeichnet werden.Er besitzt deshalb starke �Ahnlichkeit mit einem H�au�gkeitsdiagramm. Bild 1.8 zeigteinen Punkteplot f�ur die Ferkelzahlen aus Tab. 1.1.

:

: :

: : :

: : :

: : : .

. : : : : :

: : : : : :

: : : : : : .

. : : : : : : : :

. : : : : : : : : : : .

-+-------+-------+-------+-Ferkel

4.0 8.0 12.0 16.0

Bild 1.8: Punkteplot der Ferkelzahlen aus Tab. 1.1

1.1.8 H�au�gkeitsverteilungen bei nominalen Merkmalen

Tab. 1.12 zeigt die H�au�gkeitsverteilung von zehn Unkr�autern auf einem Acker �achen-st�uck.

Bei einem nominalen Merkmal wird die absolute oder relative H�au�gkeit in der Regeldurch ein Balkendiagramm mit Zwischenr�aumen zwischen den S�aulen pr�asentiert. Bild1.9 zeigt das Balkendiagramm der Unkrautverteilung in Tab. 1.12.

Da bei einem nominalen Merkmal die Reihenfolge der Stichprobenwerte beliebig variiertwerden kann, ist es nicht sinnvoll, eine Summenh�au�gkeitsfunktion zu berechnen unddarzustellen.

H�au�g erfolgt die Darstellung der nach aufsteigenden oder abfallenden H�au�gkeitengeordneten Werte im Balkendiagramm (Bild 1.10).

Page 15: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.1 Beschreibung eindimensionaler Stichproben 19

Unkraut Anzahl

G�ansefu� 13Vogelmiere 30Ehrenpreis 18Ackerstiefm�utterchen 9Franzosenkraut 2Hirtent�aschel 8Klettenlabkraut 17Kamille 33Kornblume 4Klatschmohn 4

138

Tabelle 1.12: Unkrautverteilung auf einem Acker �achenst�uck

Klatschmohn

KornblumeKamille

Klettenlabkraut

Hirtentäschel

Franzosenkraut

Ackerstiefmütterchen

Ehrenpreis

VogelmiereGänsefuß

35

30

25

20

15

10

5

0

abso

lute

Häu

figke

it

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAA

AAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

Bild 1.9: Balkendiagramm der Unkrautverteilung von Tab. 1.13

Franzosenkraut

Klatschmohn

Kornblume

Hirtentäschel

AckerstiefmütterchenGänsefuß

Klettenlabkraut

Ehrenpreis

VogelmiereKamille

35

30

25

20

15

10

5

0

abso

lute

Häu

figke

it

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAA

AAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

Bild 1.10: Verteilung der Unkr�auter in Tab. 1.12 nach fallenden H�au�gkeiten

Page 16: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

20 1 Beschreibende und explorative Statistik

1.1.9 H�au�gkeitsverteilungen bei ordinalen Merkmalen

Bei einem ordinalen Merkmal wird die absolute oder relative H�au�gkeit wie bei no-minalen Merkmalen dargestellt. Allerdings sollte die Anordnung der Merkmalswertein aufsteigender Form erfolgen, so da� auch die Berechnung der Summenh�au�gkeitenSinn macht. Tab. 1.13 zeigt das Ergebnis der Schadklassenkartierung einer Stichprobevon B�aumen in einem Untersuchungsgebiet.

Schadstufe B�aume relative H�au�gkeit Summenh�au�gkeit

ohne 31 0.248 0.248schwach 48 0.384 0.632mittel 19 0.152 0.784stark 22 0.176 0.960tot 5 0.040 1.000

125 1.000

Tabelle 1.13: H�au�gkeitsverteilung von Baumsch�aden

Bild 1.11 zeigt das Balkendiagramm der Stichprobe aus Tab. 1.13.

totstarkmittelschwachohne

50

40

30

20

10

0

Schadstufe

abso

lute

Häu

figke

it

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

Bild 1.11: Balkendiagramm der Schadstufen aus Tabelle 1.13

Page 17: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.2 Statistische Ma�zahlen eindimensionaler Stichproben 21

1.2 Statistische Ma�zahlen eindimensionaler Stichproben

Bei vielen praktischen Fragestellungen will man eine Reihe von Stichprobenwertendurch einige charakteristische Ma�zahlen beschreiben. Man unterscheidet Ma�zahlender Lage oder der zentralen Tendenz (Mittelwerte), der Variabilit�at (Streuungsma�e)sowie der Schiefe und W�olbung.

1.2.1 Arithmetischer Mittelwert

Zun�achst soll die Stichprobe vom Umfang n mit den quantitativen Stichprobenwer-ten x1; x2; : : : ; xn durch einenMittelwert gekennzeichnet werden. Mittelwerte werdenauch als Lageparameter bezeichnet. Der wichtigste Mittelwert ist der arithmetische

Mittelwert x der Stichprobenwerte. Er ist de�niert als:

x =x1 + x2 + : : :+ xn

n=

1

n�

nXi=1

xi (1.4)

Beispiel:

Bei 5 K�uhen wurden folgende j�ahrlichen Milchleistungen (in kg=a) gemessen:

x1 = 5250, x2 = 4955, x3 = 4763, x4 = 5538, x5 = 4994

Die mittlere Milchleistung ist: x =25500

5= 5100

Eine weitere Stichprobe von 5 K�uhen brachte folgende Ergebnisse:

y1 = 5032, y2 = 4270, y3 = 4922, y4 = 5430, y5 = 5846

Die mittlere Milchleistung ist: y =25500

5= 5100

Die Summe der Stichprobenwerte betr�agt bei beiden Stichproben 25500. Damit sindauch beide Mittelwerte x = y = 5100 gleich gro�.

1.2.2 Spannweite und mittlere absolute Abweichung

Die Mittelwerte oder die durchschnittlichen Jahresmilchleistungen betragen in beidenoben angef�uhrten Stichproben 5100 kg. Die zweite Stichprobe unterscheidet sich jedochau�allend von der ersten Stichprobe durch die weiter auseinanderliegenden Stichpro-benwerte. Also wird der arithmetische Mittelwert zur Kennzeichnung einer Stichprobei.a. nicht ausreichen. Aus diesem Grund werden zus�atzlich Ma�e f�ur die Streubreite derStichprobe eingef�uhrt.

Als einfachstes Ma� bietet sich die sogenannte Spannweite, Variationsbreite oderRange R an. Sie ist de�niert als Di�erenz zwischen dem gr�o�ten Stichprobenwert xmaxund dem kleinsten Stichprobenwert xmin:

R = xmax � xmin (1.5)

Page 18: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

22 1 Beschreibende und explorative Statistik

Die Spannweite R ist ein brauchbares Ma� f�ur die Streuung, wenn die Stichprobenur wenige Me�werte umfa�t (etwa bis zu 10 Me�werten). Innerhalb der Spannweitevon xmin bis xmax liegen alle Stichprobenwerte. Die Spannweite spielt eine Rolle beider Festlegung der Klassenbreite, wenn man eine gr�o�ere Stichprobe klassi�ziert. Sieist aber weniger geeignet zur Kennzeichnung der Streuung einer gro�en Anzahl vonStichprobenwerten, vor allem weil sie stark von der Zahl der Stichprobenwerte abh�angigist. Je gr�o�er die Anzahl der Beobachtungen ist, desto gr�o�er ist die Wahrscheinlichkeit,da� einzelne vomMittelwert x stark abweichende Me�werte in der Stichprobe enthaltensind.

Seltener wird die mittlere absolute Abweichung a vom Mittelwert x verwendet:

a =1

n�

nXi=1

jxi � xj (1.6)

Dabei wird die Abweichung jxi � xj des Wertes xi vom Mittelwert x absolut genom-men, obwohl die Handhabung mit den Absolutwerten etwas umst�andlich ist. F�ur kleineStichproben kann man jedoch die mittlere absolute Abweichung vom Mittelwert sowohlaus rechentechnischen als auch aus sachlichen Gr�unden als Streuungsma� benutzen.

Beispiel:

F�ur die Stichproben des Beispiels von Seite 21 berechnen sich folgende Spannweitenund mittleren absoluten Abweichungen in kg=a:

Stichprobe x Stichprobe y

max 5538 5846min 4763 4270

R 775 1576a 235 430

Bei identischen Mittelwerten von x = y = 5100 sind Spannweite und mittlere absoluteAbweichung bei der Stichprobe y praktisch doppelt so gro� wie bei der Stichprobe x.

1.2.3 Empirische Varianz und Standardabweichung

�Uberwiegend wird bei quantitativen Daten als Streuungsma� die mittlere quadrati-

sche Abweichung oder empirische Varianz verwendet. Dieses Streuungsma� wird

�ublicherweise mit s2 abgek�urzt. Die Gr�o�e s2 ist f�ur n > 1 de�niert als:

s2 =1

n� 1�

nXi=1

(xi � x)2 (1.7)

Wenn die Stichprobenwerte nicht alle gleich gro� sind, ist die Varianz immer gr�o�er alsNull. Die positive Quadratwurzel aus der Varianz s2 hei�t Standardabweichung derStichprobe oder empirische Standardabweichung und wird mit s bezeichnet. Die

Page 19: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.2 Statistische Ma�zahlen eindimensionaler Stichproben 23

Standardabweichung s hat die gleiche Dimension wie die Stichprobenwerte. Es f�allt auf,da� die Quadratsumme in Gleichung (1.7) durch n�1 und nicht durch n dividiert wird.Der Grund ist, da� die Varianz s2 bestimmte Eigenschaften erf�ullen mu�, die erst imZusammenhang mit der Wahrscheinlichkeitstheorie erkl�art werden k�onnen (vgl. Kap.4.5.2). Anschaulich l�a�t sich die Summe von n Summanden in Gleichung (1.7) auf eineSumme von n� 1 Summanden reduzieren, da der Wert des n-ten Summanden bei festgegebenen Werten von s2 und x dann �x ist. Man sagt auch, die Quadratsumme in(1.7) hat n� 1 Freiheitsgrade.

Eine zu Gleichung (1.7) alternative Berechnungsformel f�ur die empirische Varianzfolgt durch Umformung der sog. Summe der Abweichungsquadrate oder Abwei-chungsquadratsumme:

nXi=1

(xi � x)2 =

nXi=1

(x2i � 2xix+ x2) =

nXi=1

x2i � 2nx2 + nx2 =

=

nXi=1

x2i � nx2 =

nXi=1

x2i � n � 1

n

nXi=1

xi

!2

=

=

nXi=1

x2i �1

n�

nXi=1

xi

!2

(1.8)

Aus Gleichung (1.7) und (1.8) folgt:

s2 =1

n� 1�

0@ nX

i=1

x2i �1

n�

nXi=1

xi

!21A (1.9)

Gleichung (1.9) ist gegen�uber (1.7) bei Handrechnung vorzuziehen. Bei Anwendung von(1.9) in Computern k�onnen jedoch in bestimmten F�allen sehr gro�e Rundungsfehlerauftreten, und zwar dann, wenn die beiden Ausdr�ucke in der obigen Klammer nahezugleich gro� sind, d.h. wenn die Varianz im Vergleich zum Mittelwert sehr klein ist.

Beispiel:

Die Varianz der Stichprobe x des Beispiels von Seite 21 wird nach Gleichung (1.7)berechnet, die der Stichprobe y nach Gleichung (1.9):

xi � x (xi � x)2

150 22500�145 21025�337 113569438 191844

�106 11236

360174

yi y2i5032 253210244270 182329004922 242260845430 294849005846 34175716

25500 131440624

Page 20: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

24 1 Beschreibende und explorative Statistik

s2x =1

4� 360174 = 90043:5 ) sx = 300 [kg=a]

s2y =1

4��131440624� 1

5� 255002

�= 347656 ) sy = 590 [kg=a]

Die empirische Varianz in der Stichprobe y ist also trotz gleicher Mittelwerte gr�o�er.

1.2.4 Mittelwert und Varianz bei klassi�zierten Stichproben

H�au�g ist die Stichprobe in einer H�au�gkeitstabelle oder in einem Histogramm zusam-mengefa�t, d.h. es kommen insgesamtm verschiedene Werte xi (i = 1; 2; : : : ;m) vor mitjeweils den absoluten H�au�gkeiten ni (i = 1; 2; : : : ;m), wobei n1 + n2 + : : :+ nm = n,wenn n der Umfang der gesamten Stichprobe ist. Anstatt der absoluten H�au�gkeitenni k�onnen auch die relativen H�au�gkeiten hi zur Berechnung herangezogen werden.Dies ist insbesondere dann n�otig, wenn der Gesamtstichprobenumfang n nicht bekanntist, weil er nicht in der H�au�gkeitstabelle oder im Histogramm angegeben wurde.

Das arithmetische Mittel x berechnet sich dann zu:

x =1

n�

mXi=1

(ni � xi) =mXi=1

(hi � xi) (1.10)

Entsprechend lautet die Berechnungsformel f�ur die Varianz:

s2 =1

n� 1�0@ mX

i=1

(ni � x2i )�1

n�

mXi=1

(ni � xi)!21A �

�mXi=1

(hi � x2i )�

mXi=1

(hi � xi)!2

(1.11)

Es ist zu beachten, da� bei der Varianzsch�atzung �uber die relativen H�au�gkeiten derStichprobenumfang eigentlich durch n statt durch n�1 geteilt wird. F�ur gr�o�ere Stich-

proben ist dieser Fehler sehr gering, weil dann1

n� 1

n� 1ist.

Beispiel:

Die mittlere Ferkelzahl pro Wurf der Stichprobe aus Tab. 1.1 und ihre empirischeVarianz wird mit Hilfe der absoluten H�au�gkeiten aus Tab.1.7 berechnet.

Page 21: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.2 Statistische Ma�zahlen eindimensionaler Stichproben 25

xi ni ni � xi ni � x2i4 1 4 165 0 0 06 3 18 1087 9 63 4418 10 80 6409 18 162 145810 20 200 200011 16 176 193612 11 132 158413 5 65 84514 4 56 78415 2 30 45016 1 16 256P

100 1002 10518

x =1

100� 1002 = 10:02, s2 =

1

99��10518� 1

100� 10022

�= 4:828 ) s = 2:197

Auch bei klassi�ziertem Datenmaterial einer Stichprobe berechnet man Mittelwert undVarianz mit Hilfe der Gleichungen (1.10) und (1.11). Man verf�ahrt so, als ob alle Stich-probenwerte einer Klasse auf der Klassenmitte liegen, allerdings unter der Vorausset-zung, da� keine o�en endenden Intervalle wie z.B. x < a oder x > b vorkommen. ImFalle klassi�zierter Stichproben f�allt der Fehler bei der Varianzsch�atzung �uber die re-lativen H�au�gkeiten nicht sehr ins Gewicht, da die Gr�o�e von Mittelwert und Varianzvon der Klasseneinteilung abh�angen

Beispiel:

Als Beispiel dient die klassi�zierte Stichprobe der Milchleistungen aus Tab. 1.8. Es wirdangenommen, da� der Stichprobenumfang unbekannt ist, also lediglich die relativenH�au�gkeiten bekannt sind.

xi (Klassenmitte) hi hi � xi hi � x2i3800 0:05 190 7220004200 0:08 336 14112004600 0:14 644 29624005000 0:22 1100 55000005400 0:20 1080 58320005800 0:24 1392 80736006200 0:03 186 11532006600 0:04 264 1742400P

1:00 5192 27296800

x = 5192 [kg=a], s2 = (27296800� 51922) = 339936 ) s = 583 [kg=a]

Page 22: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

26 1 Beschreibende und explorative Statistik

1.2.5 Gewogener arithmetischer Mittelwert

Der gewogene arithmetische Mittelwert wird verwendet, wenn die einzelnen Stich-probenwerte xi nicht gleichberechtigt bei der Durchschnittsbildung mitwirken, son-dern gewichtet werden sollen. Bei einer Diplompr�ufung gehen z.B. nicht alle Noten xi(i = 1; 2; : : : ;m) der Pr�ufungsf�acher mit gleichem Gewicht in die Endnote x ein, son-dern entsprechend den in der Pr�ufungsordnung festgelegten Gewichten g1; g2; : : : ; gm,wobei g1 + g2 + : : :+ gm = n. Das gewogene Mittel xgew berechnet sich dann zu:

xgew =1

n�

mXi=1

(gi � xi) (1.12)

Wenn man Mittelwerte x1; x2; : : : ; xm von mehreren Stichproben verschiedenen Um-fangs vorliegen hat, kann man einen gemeinsamen Mittelwert x ausrechnen, indem manentsprechend den Stichprobenumf�angen n1; n2; : : : ; nm gewichtet:

x =n1x1 + n2x2 + : : :+ nmxm

n1 + n2 + : : :+ nm=

mXi=1

(ni � xi)mXi=1

ni

(1.13)

Beispiel:

Auf einem Versuchsgut in Weihenstephan wurden folgende Ernteertr�age erzielt:

dt=ha ha

Winterweizen 63:4 15:1Sommerweizen 54:8 14:5Wintergerste 56:4 7:0Sommergerste 51:2 8:1Hafer 45:9 8:3

53:0

Der durchschnittliche Getreideertrag aller Fl�achen errechnet sich dann durch Gewich-tung der einzelnen Ertr�age mit ihren Fl�achen:

x =63:4 � 15:1 + 54:8 � 14:5 + 56:4 � 7:0 + 51:2 � 8:1 + 45:9 � 8:3

53:0= 55:52

Das gewogene arithmetische Mittel wird insbesondere in der amtlichen Statistik zurBerechnung von sog. Indizes verwendet (z.B. Lebenshaltungskostenindex, Index derGro�handelspreise, Aktienindex usw.).

Page 23: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.2 Statistische Ma�zahlen eindimensionaler Stichproben 27

1.2.6 Geometrischer Mittelwert

Die De�nition des geometrischenMittels xgeom aus n positiven Beobachtungswertenx1; x2; : : : ; xn lautet:

xgeom = n

px1 � x2 � : : : � xn (1.14)

Es ist log xgeom =1

n� (log x1 + logx2 + : : : + logxn), d.h. der Logarithmus des geo-

metrischen Mittels xgeom ist gleich dem arithmetischen Mittel der Logarithmen derStichprobenwerte.

Das geometrische Mittel ist stets kleiner als das arithmetische Mittel (nur wenn al-le Stichprobenwerte gleich sind, fallen die beiden Mittel zusammen). Eine sinnvolleAnwendung des geometrischen Mittels ist angebracht, wenn man relative �Anderungenmitteln will, z.B. bei Wachstumsvorg�angen, bei denen sich eine Variable mit der Zeit inann�ahernd konstantem Verh�altnis �andert oder wenn die Variationsbreite der Stichpro-benwerte im Vergleich zum arithmetischen Mittelwert sehr gro� ist. Das geometrischeMittel wird n�amlich durch Extremwerte nicht so stark beein u�t wie das arithmetischeMittel oder anders ausgedr�uckt, wenn die Stichprobenwerte ann�ahernd logarithmischnormalverteilt sind (siehe Kap. 3.2).

Beispiel:

Gegeben seien die Absatzsteigerungen eines Unternehmens von 5%, 7% und 12% in dreiaufeinanderfolgenden Jahren. Die Prozentzahlen sind dabei jeweils auf den vorj�ahrigenAbsatz bezogen. Wie gro� ist die durchschnittliche Absatzsteigerung x?

Man mu� x so berechnen, da� die dreimalige Anwendung der durchschnittlichen Ab-satzsteigerung x zum gleichen Ergebnis f�uhrt wie die oben angef�uhrten verschiedenenSteigerungsraten x1 = 0:05, x2 = 0:07 und x3 = 0:12, also:

(1 + x)3 = (1 + x1) � (1 + x2) � (1 + x3) = 1:05 � 1:07 � 1:12 )1 + x = 3

p1:05 � 1:07 � 11:2 ) x = 3

p1:25832� 1 = 0:0796 � 8%

Der durchschnittliche Multiplikationsfaktor 1 + x ist also das geometrische Mittel ausden drei unterschiedlichen Multiplikationsfaktoren 1:05, 1:07 und 1:12.

Man kann zeigen, da� das geometrische Mittel xgeom von Stichprobenwerten xi > 0mit dem arithmetischen Mittel x sehr gut �ubereinstimmt, wenn die relative Abweichungxi � x

xder Stichprobenwerte dem Betrag nach sehr klein ist.

1.2.7 Variationskoe�zient

Sehr oft interessiert nicht die Standardabweichung s allein, sondern ihre Relation zumMittelwert. Dieses relative Ma� der Standardabweichung prozentual bezogen auf denarithmetischen Mittelwert hei�t Variationskoe�zient (VK).

VK =s

x(1.15)

Page 24: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

28 1 Beschreibende und explorative Statistik

Mit Hilfe des Variationskoe�zienten kann man die Streuung oder die Variation zweierMerkmale miteinander vergleichen, die in verschiedenen Ma�einheiten gemessen wur-den.

Wenig Sinn hat die Verwendung des Variationskoe�zienten, wenn in die Berechnungvon x auch negative Beobachtungswerte eingehen.

Beispiel:

Tab. 1.14 zeigt die Mittelwerte und Standardabweichungen f�ur eine Reihe verschiede-ner Merkmale (Stichprobenumfang n = 30), die bei der Schweinemastpr�ufung erfa�twerden. Aus der Spalte des Variationskoe�zienten ist zu entnehmen, da� die Merkmaleder Mastleistung (t�agliche Zunahme, Futterverwertung) weniger variabel sind als dieMerkmale der Schlachtk�orperqualit�at.

Merkmal x s VK [%]

t�agl. Zunahme 720.2 g 46.3 g 6.43Futterverwertung 3.016 0.164 5.44K�orperl�ange 99.53 cm 2.78 cm 2.79Schlachtk�orpergewicht 77.083 kg 2.535 kg 3.29R�uckenspeckdicke 2.86 cm 0.35 cm 12.24Seitenspeckdicke 3.08 cm 0.62 cm 20.13Fleisch �ache 33.30 cm2 3.70 cm2 11.11Fett �ache 24.91 cm2 4.14 cm2 16.62

Tabelle 1.14: Mittelwert x, Standardabweichung s sowie Variationskoe�zient VKverschiedener Merkmale einer Stichprobe �uber die Mastleistung undSchlachtk�orperqualit�at bei Schweinen

1.2.8 Median oder Zentralwert

Wenn man die Me�werte xi der Gr�o�e nach ordnet, so liegt der Zentralwert oderMedian ex in der Mitte dieser Stichprobenwerte. Links und rechts von ex liegen gleichviele Stichprobenwerte oder Beobachtungen. Wenn eine ungerade Zahl von Beobach-tungen vorliegt, so ist der Zentralwert eindeutig als die mittlere Beobachtung de�niert.Bei einer geraden Zahl von Beobachtungen ist der Zentralwert nicht mehr eindeutig,sondern eine Zahl zwischen den beiden mittleren Beobachtungen. Meist nimmt mandann die Mitte dieser beiden mittleren Beobachtungen (vgl. Bild 1.12).

-

x1 x2 x3 x4 x5 x6 x7

exn = 7

-

x1 x2 x3 x4 x5 x6

Bereich f�ur exn = 6

Bild 1.12: Median bei einer ungeraden und geraden Anzahl von Stichprobenwerten

Der Median hat z.B. den Vorteil, da� man ihn bei einer Rangskala, also bei ordinalenDaten verwenden kann, bei der die Berechnung des arithmetischen Mittels nicht mehrm�oglich ist.

Page 25: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.2 Statistische Ma�zahlen eindimensionaler Stichproben 29

Beispiele:

1. Der Median bei der Schadklassenkartierung von B�aumen in Tab. 1.13 ist die Schad-stufe des 63: Baums, also ex = schwach. Das hei�t, die eine H�alfte aller B�aumeist schwach oder nicht gesch�adigt, die andere H�alfte ist schwach oder schlimmergesch�adigt. Man kann auch die H�au�gkeiten f�ur die Schadstufen berechnen und an-schlie�end die Summenh�au�gkeiten bestimmen. Der Median der Verteilung nimmtdann den Wert an, an dem die Summenh�au�gkeitsfunktion den Wert 0:5 erreicht.

2. Aus Tab. 1.10 �uber die Stichprobe der Ferkelzahlen ist der Median leicht als ex = 10abzulesen, da die Summenh�au�gkeitsfunktion bei 10 Ferkeln den Wert 0:5 �uber-schreitet. Im vorliegenden Fall gibt es auch keine Probleme mit dem geradzahligenStichprobenumfang, da die n�achst niedrigere und h�ohere Ferkelzahl ebenfalls 10betr�agt. Die H�alfte aller Sauen hat also 10 oder weniger Ferkel/Wurf, die ande-re H�alfte 10 oder mehr. Mittelwert x = 10:2 und Median ex = 10 sind hier fastidentisch.

Der Median wird von den speziellen Werten der gr�o�ten und kleinsten Beobachtungnicht ber�uhrt und er stellt daher ein \robusteres\ Ma� der Lage oder der zentralenTendenz dar als der arithmetische Mittelwert. Robust bedeutet in diesem Zusammen-hang, da� ex von m�oglichen \Ausrei�erwerten\ der Stichprobe nicht oder viel wenigerabh�angig ist als der Mittelwert x.

Wenn die Stichprobenwerte bei einer stetigen Variablen klassi�ziert sind, gibt man alsZentralwert entweder nur dieMedianklasse an, also die Klasse, in der der Zentralwertliegt, oder man liest in der Summenh�au�gkeitsfunktion den zu eF (x) = 0:5 geh�origenWert auf der Abszisse ab. Eine lineare Interpolation mit Hilfe der Summenh�au�gkeits-funktion kann auch �uber folgende Interpolationsformel erfolgen:

ex = u+ b � 0:5�eF (u)efMedian

; (1.16)

wobei u die untere Klassengrenze der Medianklasse, b die Klassenbreite, eF (u) der Wert

der Summenh�au�gkeitsfunktion an der unteren Grenze der Medianklasse und efMedian

die relative H�au�gkeit der Medianklasse ist.

Beispiel:

Es wird die klassi�zierte Stichprobe der Milchleistungen von Tab. 1.11 betrachtet. DieMedianklasse ist das Intervall von 5200 : : :5600. In der Summenh�au�gkeitsfunktion vonBild 1.6 kann man bei eF (0:5) den Median zu etwa ex = 5200 absch�atzen. Dies korre-spondiert auch mit den Werten in Tab. 1.11, denn bei 5200 hat die Summenh�au�g-keitsfunktion bereits den Wert 0:49 und 0:50 wird bei einem geringf�ugig h�oheren Werterreicht. Mit Hilfe von Gleichung (1.16) wird der Median zu

ex = 5200+ 400 � 0:5� 0:49

0:20= 5220

gesch�atzt. Der wahre Median, der aus den Originaldaten von Tab. 1.8 berechnet wurde,liegt zwischen 5221 und 5242. Das Mittel aus diesen beiden Werten ist 5231:5. Dasarithmetische Mittel x = 5188:67 ist hier etwas kleiner als der Median.

Page 26: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

30 1 Beschreibende und explorative Statistik

Der Zentralwert hat die charakteristische Eigenschaft, da� die Summe der absolutenAbweichungen der Beobachtungen xi von ihrem Zentralwert ex kleiner ist als von jederanderen Zahl. Diese Summe ist also ein Minimum.

1.2.9 Modus oder Dichtemittel

Der Modalwert, Modus oder das Dichtemittel xd ist derjenige Stichprobenwert,der am h�au�gsten vorkommt.

Beispiel:

Bei der Stichprobe mit den Ferkelzahlen von Tab. 1.1 ist die Ferkelzahl xd = 10 derModalwert (vgl. Bild 1.3).

Es k�onnen in einer Stichprobe mehrere modale Werte vorkommen. So unterscheidetman neben unimodalen oder eingip igen Verteilungen auch bimodale oder zwei-gip ige und schlie�lich multimodale oder mehrgip ige Verteilungen. Ein Dichte-mittel ist in solchen F�allen jeweils als ein Wert bestimmt, der h�au�ger vorkommt alsseine Nachbarwerte. So spricht man auch genauer vom h�au�gsten Wert als demabsoluten Dichtemittel oder dem 1. Modalwert und bezeichnet weitere relative Dich-temittel als 2. Modalwert usw.

Beispiel:

Bei der Stichprobe in Bild 1.11 ist die Schadstufe schwach der erste Modus und dieSchadstufe stark der zweite Modus.

Bei nominalen bzw. kategorialen Daten ist nur die Bestimmung des ersten Dichtemittelsm�oglich. Andere Mittel k�onnen in diesem Fall nicht bestimmt werden.

Beispiel:

Bei der Unkrautverteilung in Bild 1.9 macht nur das erste Dichtemittel bei der Kamilleals Lageparameter Sinn, da die Anordnung der Nominaldaten auf der Abszisse beliebigvariiert werden kann (vgl. Bild 1.10).

Es ist einleuchtend, da� bei einer ausgepr�agten Mehrgip igkeit einer Verteilung dieDichtemittel diese Verteilung besser beschreiben k�onnen als das arithmetische Mitteloder der Median, da deren Gr�o�e in einem Bereich liegen k�onnen, in denen sehr wenigeoder im Extremfall gar keine Me�werte liegen.

Page 27: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.2 Statistische Ma�zahlen eindimensionaler Stichproben 31

Beispiel:

Bild 1.13 zeigt die H�au�gkeitsverteilung der in einer zweiw�ochigen Beobachtungsperi-ode gelegten Eier von H�uhnern.

13121110987654

0.25

0.20

0.15

0.10

0.05

0.00

Anzahl der Eier

rela

tive

Häu

figke

it

AAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAA

AAAAAAAAAAAA

AAAAAAAAAAAA

AAA

2

14

29

13

6

15

23

13

4

1

Bild 1.13: Histogramm der Anzahl von H�uhnereiern

Mittelwert und Median x = ex = 9 fallen genau in einen Bereich, in denen die H�au�gkeitsehr gering ist. Der erste Modus bei 11 und der zweite Modus bei 7 beschreiben dieVerteilung als Lageparameter viel besser. Dies wird auch klar, wenn man wei�, da�das Histogramm in Bild 1.13 die Eianzahl zweier H�uhnerrassen ist, deren Mittelwertegetrennt nach Rassen jeweils 7 und 11 betr�agt.

Bei diskreten Merkmalsauspr�agungen ist die Bestimmung der Dichtemittel relativ ein-fach und klar. Wie geht man jedoch bei stetigen Merkmalswerten vor, wenn also eineklassi�zierte Verteilung in Form eines Histogramms vorliegt? Entweder nimmt man diegesamte Klassenbreite oder die Klassenmitte als Modus oder man pa�t der Verteilungin der Umgebung des zu bestimmenden Dichtemittels, also an der am st�arksten besetz-ten Klasse sowie den beiden Nachbarklassen, eine Interpolationsparabel an und nimmtdie Stelle, an der die Parabel ihr Maximum hat, als Dichtemittel an dieser Stelle.

Beispiel:

Bild 1.14 zeigt die Verteilung der Schlafdauer von 150 Probanden beim Test einesSchlafmittels.

Die h�au�gsten Schlafdauern liegen zwischen 7 und 8 Stunden. Die Klassenmitte diesesIntervalls von 7:5 als Dichtemittel anzugeben ist hier nicht sehr elegant. Eine Sch�atzungkann durch Interpolation erfolgen, wenn man eine Parabel durch die Punkte (6:5; 44),(7:5; 61) und (8:5; 26) legt. Diese Parabel bestimmt man leicht zu �26x2+381x�1334.Die erste Ableitung gleich Null gesetzt ergibt �52x + 381 = 0. Daraus folgt xd =7:3296 � 7:33.

Auch bei sehr schiefen Verteilungen (vgl. Kap. 1.2.13) kann das Dichtemittel ein geeig-netes Ma� f�ur die Verteilung sein.

Page 28: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

32 1 Beschreibende und explorative Statistik

98765432

60

50

40

30

20

10

0

Schlafdauer [h]

abso

lute

Häu

figke

it

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAA

AAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAA

AAAAAAAAAA

AAAAAAAAAAAA

AAAAAAAAAAAA

AAAAAAAAAAAA

AAAAAAAAAAAA

AAAAAA

26

61

44

8632

Bild 1.14: Histogramm der Schlafzeiten von 150 Personen

Beispiel:

Es liegen folgende DM-Betr�age als Stichprobenwerte einer Spendenaktion vor:

100000.{ DM, 100.{ DM, 100.{ DM, 100.{ DM, 100.{ DM, 50.{ DM

Das arithmetische Mittel x ist rund 16741.{ DM. Wenn man behauptet, da� im Durch-schnitt rund 16741.{ DM gespendet wurden, so ist dies zwar mathematisch richtig, tri�taber nicht den Kern der Sache. Hier verwendet man besser den Modalwert, und mankann in diesem Falle sagen: Die h�au�gste Spende betrug 100.{ DM.

1.2.10 Standardfehler des arithmetischen Mittels

Das arithmetische Mittel x einer Stichprobe wird h�au�g als Approximation oder Sch�atz-wert des unbekannten Mittelwerts der dazugeh�origen Grundgesamtheit verwendet. DieVarianz s2 der Stichprobe ist entsprechend ein Sch�atzwert f�ur die unbekannte Varianzin der Grundgesamtheit (vgl. 4.5).

Entnimmt man einer unendlich gro�en Grundgesamtheit mehrere Stichproben und be-rechnet jeweils das Stichprobenmittel, so stellt man fest, da� diese Stichprobenmittel-werte weniger streuen als die Einzelbeobachtungen einer Stichprobe. Die Standardab-weichung dieser Stichprobenmittelwerte ist ein Ma� f�ur die Variabilit�at der Stichpro-benmittelwerte. Es ist einsichtig, da� die Abweichung eines Stichprobenmittels x vom

unbekannten Mittelwert der Grundgesamtheit umso kleiner ist, je kleiner die Streuungf�ur die Einzelwerte in der Grundgesamtheit ist und je gr�o�er der Stichprobenumfangist.

Stellt man sich nun gedanklich eine unendliche Wiederholung der Stichprobenziehungmit anschlie�ender Berechnung des arithmetischen Mittelwerts vor, so kommt manzu einer (hypothetischen) Grundgesamtheit von Stichprobenmittelwerten, die jeweilsaus einem Umfang n berechnet wurden. Es besteht eine einfache Beziehung zwischender Standardabweichung in der Grundgesamtheit der arithmetischen Mittelwerte undder Standardabweichung in der Grundgesamtheit der Einzelwerte, deren genaue Be-gr�undung im Zusammenhang mit der Verteilung von Zufallsgr�o�en ersichtlich wird.

Page 29: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.2 Statistische Ma�zahlen eindimensionaler Stichproben 33

Indem man diese Beziehung auf die Sch�atzwerte �ubertr�agt, wird der sp�ateren Her-leitung (vgl. 3.1.3) vorausgegri�en. Der Sch�atzwert f�ur die Standardabweichung desarithmetischen Mittels x hei�t auch Standardfehler des arithmetischen Mittel-

werts sx.

Es gilt:

sx =spn

=

vuut 1

n � (n� 1)�

nXi=1

(xi � x)2 =

=

vuuut 1

n � (n� 1)�

0@ nX

i=1

x2i �1

n

nX

i=1

xi

!21A

(1.17)

In der Physik bezeichnet man sx auch als mittleren Fehler. Jede Stichprobe liefertn�amlich zuf�allige Werte f�ur die einzelnen xi und somit auch f�ur den Mittelwert x. DasStreuungsma� der Standardabweichung wird dabei als \mittlere\ Abweichung inter-pretiert. So wird die Standardabweichung s als mittlerer Fehler f�ur ein xi bzw. eineEinzelbeobachtung bezeichnet, und der Standardfehler sx wird als mittlerer Fehler desMittelwerts bezeichnet.

1.2.11 Zur Wahl eines Mittelwerts

Jeder Mittelwert gibt stellvertretend f�ur eine ganze Reihe von Einzelwerten einen ein-zigen Wert als Lageparameter an. Ein Mittel kann deshalb nicht kurz in einer einzigenZahl das Wesentliche ausdr�ucken und gleichzeitig alle Details der H�au�gkeitsvertei-lung enth�ullen. Ein Mittelwert verdeckt und gl�attet unter Umst�anden Extremwerteund wird je nach De�nition mehr oder weniger von ihnen beein u�t. Um das richti-ge Mittel zu �nden, �uberlegt man sich vorher, welcher Lageparameter am besten zurCharakterisierung der Daten geeignet ist.

Am h�au�gsten wird das arithmetische Mittel verwendet. Die Vorteile des arithmeti-schen Mittels sind:

1. Multiplikation mit der Anzahl n ergibt die Summe der insgesamt beobachtetenMerkmalswerte.

2. Die arithmetischen Mittelwerte verschiedener Gruppen k�onnen kombiniert werden.Durch ein gewogenes Mittel �ndet man das arithmetische Mittel der kombiniertenGruppen.

3.

nXi=1

(xi � x) = 0, d.h. die Summe der positiven und der negativen Abweichungen

sind der Gr�o�e nach gleich.

4. Die Summe der quadratischen Abweichungen

nXi=1

(xi � x)2 ist kleiner als f�ur jede

andere Zahl.

Page 30: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

34 1 Beschreibende und explorative Statistik

Der zweitwichtigste Mittelwert ist der Zentralwert oder Median. Er teilt die Beobach-tungen in zwei H�alften, d.h. links und rechts von ihm liegen jeweils 50% der Beobach-tungswerte. Bei ungeradem n f�allt der Median genau auf den mittelsten Beobachtungs-wert, den man \halb zur linken und halb zur rechten Gruppe\ der Beobachtungswertez�ahlt. Wenn man wei�, da� die betrachtete Verteilung symmetrisch ist, kann man denleichter zu bestimmenden Zentralwert als gute Sch�atzung f�ur das arithmetische Mittelheranziehen. Der Zentralwert kann im Gegensatz zum arithmetischen Mittel bei ei-ner klassi�zierten H�au�gkeitsverteilung auch berechnet werden, wenn diese Verteilungo�en-endende Klassen enth�alt. Bei ordinalen Daten ist der Zentralwert das Mittelwerts-ma� der Wahl.

Der Modalwert oder das Dichtemittel ist sinnvoll, wenn man den gew�ohnlichsten oderh�au�gsten Wert charakterisieren will, insbesondere bei stark unsymmetrischen oderschiefen Verteilungen. Bei nominalen Daten kann als Lageparameter ausschlie�lich dasDichtemittel angegeben werden.

Das geometrische Mittel ist zur Messung des Mittels einer Ver�anderung angebracht,wenn man eine durchschnittliche Ver�anderungsrate berechnen m�ochte. Das geometri-sche Mittel oder auch der Median charakterisieren solche unsymmetrischen Verteilun-gen von positiven Werten gut, die durch �Ubergang auf die Logarithmen dieser Wertein eine symmetrische Verteilung transformiert werden.

Bei einer symmetrischen eingip igen Verteilung fallen Modalwert, Median und arithme-tisches Mittel zusammen. Bei unsymmetrischen Verteilungen weichen diese drei Mittelmehr oder weniger voneinander ab. Es reicht in solchen F�allen nicht immer aus, nur einbestimmtes Mittel anzugeben, um die Lage der Verteilung zu charakterisieren. NebenMittelwert gibt man dann noch Schiefe und evtl. W�olbung an (vgl. Kap. 1.2.13).

In der beurteilenden Statistik wird bei quantitativen Beobachtungen vorwiegend dasarithmetische Mittel x als Lageparameter und die Standardabweichung s als Variabi-lit�atsma� verwendet. Der Grund ist, da� diese Ma�zahlen einer Stichprobe optimaleApproximationseigenschaften (vgl. Kap. 4.5.2) in Bezug auf die analogen Ma�zahlender Grundgesamtheit haben, insbesondere wenn man f�ur die Verteilung der Grundge-samtheit die Normalverteilung (vgl. Kap. 3.1) voraussetzt.

So besitzt das arithmetische Mittel die kleinste Varianz unter allen m�oglichen Mittel-werten (vgl. Eigenschaft 4 oben) und strebt mit wachsendem Umfang der Stichprobe\am besten\ gegen den unbekannten Mittelwert der Grundgesamtheit.

L�a�t man jedoch die Annahmen der Normalverteilung fallen und setzt beispielsweiseeine Laplace-Verteilung (vgl. Kap. 4.5.2) f�ur die Grundgesamtheit voraus, dann ist derMedian als Lageparameter dem arithmetischen Mittel eindeutig vorzuziehen.

Normalverteilung und Laplace-Verteilung sind beide symmetrische Verteilungen, un-terscheiden sich aber dadurch, da� die Laplace-Verteilung \dickschw�anziger\ ist, d.h.gr�o�ere Abweichungen vom Mittelwert sind wahrscheinlicher als bei der Normalvertei-lung.

Nimmt man f�ur die Grundgesamtheit eine gegen�uber der Laplace-Verteilung noch dick-schw�anzigere Verteilung an, z.B. eine Cauchy-Verteilung (vgl. Kap. 4.5.2), dann kannman zeigen, da� das arithmetische Mittel x als Ma� der zentralen Tendenz sinnlos wird.Auch in diesem Fall ist es angebracht, den Median als Lageparameter zu verwenden.

Page 31: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.2 Statistische Ma�zahlen eindimensionaler Stichproben 35

Neben arithmetischem Mittelwert und Median verwendet man im Rahmen der sog. ro-busten Statistik weitere Mittelwerte zur Beschreibung und Sch�atzung der zentralenTendenz. Diese \robusten\ Mittelwerte versuchen, unabh�angig von der Verteilung derzugrundeliegenden Grundgesamtheit, aus der man sich die Stichprobe gezogen denkt,m�oglichst e�ziente Sch�atzungen der zentralen Tendenz zu liefern (vgl. Kap. 4.5.2).Solche Mittelwerte sind z.B. die getrimmten Mittelwerte. Diese werden berechnet,indem man vom oberen und unteren Ende der geordneten Stichprobenwerte jeweilseinen bestimmten Prozentsatz der Beobachtungen wegl�a�t und das arithmetische Mit-tel aus den restlichen Beobachtungen errechnet. F�ur das 5%-getrimmte Mittel x5%(manchmal sagt man auch gestutztes Mittel) werden also jeweils die 5% gr�o�tenund kleinsten Werte der Stichprobe abgeschnitten und aus den restlichen 90% derWerte wird das arithmetische Mittel berechnet. Diese getrimmten Mittelwerte habenden Vorteil, robust gegen�uber Ausrei�ern zu sein. Ausrei�er sind Beobachtungen, dieweit entfernt vom �uberwiegenden Teil der Beobachtungen liegen, z.B. falsch notier-te Werte, also grobe Fehler. Die Identi�zierung von Ausrei�ern ist nicht einfach. Eineinziger Ausrei�er kann aber das arithmetische Mittel als Sch�atzwert f�ur den Lagepara-meter v�ollig unbrauchbar machen. Der 5%-getrimmte Mittelwert dagegen toleriert 5%Ausrei�er auf beiden Seiten der Stichprobenwerte. Er verliert andererseits nur wenigeProzent an E�zienz bei der Sch�atzung des Lageparameters (vgl. Kap. 4.5.2).

1.2.12 Zur Wahl eines Streuungsma�es

Anschaulich ist die Streuung einer Verteilung durch die Spannweite R, also die Dif-ferenz zwischen gr�o�ter und kleinster Beobachtung, charakterisierbar. Bei Stichpro-benumf�angen bis etwa 10 kann man die Spannweite noch gut als Streuungsma� imbeschreibenden Sinne verwenden. Bei gr�o�eren Stichproben sagt die Spannweite aberwenig dar�uber aus, wie die Einzelwerte um den Mittelwert streuen, weil mit wachsen-dem n auch die Wahrscheinlichkeit zunimmt, da� Ausrei�er auftreten, die die Spann-weite als Streuungsma� verzerren.

Bei quantitativen Daten verwendet man in der Regel die Standardabweichung s bzw.die Varianz s2 als Streuungsma�. In Verbindung mit dem arithmetischen Mittel gibtdie Standardabweichung einen brauchbaren �Uberblick �uber die empirische Verteilungder Stichprobe, wenn man Normalverteilung voraussetzt. Die Standardabweichung istneben dem Mittelwert ein entscheidender Parameter der Normalverteilung. In Kapitel3.1 wird gezeigt, da� rund 68% aller Beobachtungen um h�ochstens eine Standardabwei-chung vom Mittelwert nach links oder rechts entfernt und rund 95% aller Beobachtun-

gen um h�ochstens zwei Standardabweichungen nach links oder rechts vom Mittelwertentfernt liegen.

Bei ordinalen Daten, aber auch im Rahmen der explorativen Statistik, verwendet manals Streuungsma� den sog.Quartilsabstand. Dieser ist unemp�ndlich gegen Ausrei�erund stellt daher ein robustes Streuungsma� dar. Um den Quartilsabstand zu erkl�aren,denkt man sich die Stichprobenwerte der Gr�o�e nach geordnet und teilt die Daten inetwa gleich gro�e Gruppen auf. Bei 4 Gruppen gelangt man zu den Quartilen Q1,Q2, Q3. Diese teilen die gesamte Spannweite xmin bis xmax so auf, da� vier Gruppenentstehen, welche jeweils 25% der Stichprobenwerte enthalten (Bild 1.15). Als Streu-ungsma� bietet sich dann der Interquartilsabstand Q3�Q1 an, also der Bereich, indem die mittleren 50% der Beobachtungen liegen.

Page 32: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

36 1 Beschreibende und explorative Statistik

xmin Q1 Q2 = Median Q3 xmax

� -Q3 �Q1

25% 50% 25%

Bild 1.15: Interquartilsabstand Q3 �Q1 als Streuungsma�

Ein weiteres sehr robustes Streuungsma� ist die sog.Median-AbweichungMAD (vonengl. median absolute deviation). Man erh�alt sie, wenn man in Gleichung (1.6) f�ur dieBerechnung der mittleren absoluten Abweichung jeweils die arithmetische Mittelwert-bildung durch den Median ersetzt:

MAD = Median (jxi � exj) (1.18)

Auch im Bereich (ex�MAD : : : ex+MAD) liegen 50% der Stichprobenwerte. Zum Ver-gleich: Im Bereich (x� s : : : x+ s) liegen ca. 2=3 der Stichprobenwerte.

1.2.13 Schiefe

Das Dichtemittel weicht bei quantitativen Daten umso st�arker vom arithmetischenMittel ab, je unsymmetrischer eine Verteilung ist. Bild 1.16 zeigt eine solche unsym-

metrische Verteilung. Darin sind Weizenbl�atter auf ihren Befall nach einer Skalavon 0 (kein Befall) bis 9 (Totalbefall) bonitiert.

9876543210

25

20

15

10

5

0

Mehltaubonitur

abso

lute

Häu

figke

it

AAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAA

AAAA

133

57

10

15

21

24

1

Bild 1.16: Bonitur des Mehltaubefalls von Weizenbl�attern

Der Modus der Verteilung in Bild 1.16 ist xd = 1, das arithmetische Mittel ist x = 3.Der Median ex = 2 liegt zwischen Dichtemittel und arithmetischem Mittelwert undteilt die Verteilung in zwei gleiche H�alften. Das arithmetische Mittel ist in diesem Falldas gr�o�te Mittel. Man nennt die Verteilung in Bild 1.16 linkssteil, linksschief oderpositiv schief. Eine linksschiefe Verteilung ist typisch f�ur Bonituren, da starke Bef�allewesentlich weniger h�au�g auftreten als geringe Bef�alle.

Page 33: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.2 Statistische Ma�zahlen eindimensionaler Stichproben 37

Eine Verteilung wie in Bild 1.14 nennt man rechtssteil, rechtsschief oder negativschief . F�ur die Stichprobe der Schlafdauern in Bild 1.14 ist im Unterschied zur links-schiefen Verteilung von Bild 1.16 das arithmetische Mittel x = 7:0 h der kleinste, derMedian ex = 7:2 der mittlere und der Modalwert xd = 7:3 h der gr�o�te Lageparameter.

Eine extrem linksschiefe Verteilung, deren Modalwert ganz links liegt, wird als L-Verteilung bezeichnet. Bild 1.17 zeigt eine L-Verteilung des Betriebseinkommens einerStichprobe von 25 landwirtschaftlichen Betrieben.

240000220000

200000180000

160000140000

120000100000

8000060000

40000

10

8

6

4

2

0

Reineinkommen [DM]

abso

lute

Häu

figke

it

AAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

Bild 1.17: Betriebseinkommen Landwirtschaftlicher Betriebe

Eine extrem rechtsschiefe mit dem Modalwert rechts au�en hei�t entsprechend J-

Verteilung. Die Bezeichnungen kommen von der Form der Buchstaben L und J, dieann�ahernd wie solche Verteilungen aussehen.

Bei L- und J-Verteilungen sind arithmetisches Mittel x und Modalwert xd keine geeig-neten Parameter. Der Median ex ist in diesen F�allen vorzuziehen, da er die Stichprobein zwei H�alften teilt. Aus Bild 1.17 kann man z.B. das arithmetische Mittel nach Glei-chung (1.10) zu x = 72800 DM sch�atzen. In der Klasse dieser Gr�o�e liegen jedoch nurzwei Beobachtungen. Auch die Klasse des Modus mit der Klassenmitte von 40000 DMcharakterisiert die Einkommensverteilung nicht sehr gut. Es emp�ehlt sich hier dieAngabe des mittelsten Betriebs, da dieser Betrieb mindestens genauso viel wie die 12schlechteren und weniger als die 12 besseren Betriebe erwirtschaftet hat. Dieser Betriebliegt in der Medianklasse mit der Klassenmitte 60000 DM.

Es gibt mehrere M�oglichkeiten, die Schiefe einer Verteilung durch eine Ma�zahl zucharakterisieren.

Ein einfaches Ma� ist das Pearsonsche Schiefheitsma� S1. Es verwendet die Dif-ferenz zwischen arithmetischem Mittel x und Dichtemittel xd bezogen auf die Stan-dardabweichung s, weil die Schiefe einer Verteilung umso weniger au��allt, je gr�o�er dieStreuung einer Stichprobe ist.

S1 =x� xd

s(1.19)

Page 34: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

38 1 Beschreibende und explorative Statistik

Falls x > xd und damit S1 > 0 ist, handelt es sich um eine linksschiefe Verteilung. Fallsx < xd und damit S1 < 0 ist, handelt es sich um eine rechtsschiefe Verteilung.

Weil in manchen F�allen die Bestimmung des Dichtemittels nicht einfach bzw. auch nichteindeutig ist, verwendet ein anderes Schiefema� S2 die dreifache Di�erenz zwischenarithmetischem Mittel x und Median ex, ebenfalls bezogen auf die Standardabweichungs.

S2 =3 � (x� ex)

s(1.20)

Auch hier gilt: Falls x > xd und damit S2 > 0 ist, ist die Verteilung linksschief, imumgekehrten Fall (S2 < 0) rechtsschief.

Am h�au�gsten verwendet man jedoch als Schiefema� das sog. 3. Moment bez�uglich

des Mittelwerts x, also M3 =1

n�

nXi=1

(xi � x)3), bezogen auf die dritte Potenz der

Standardabweichung s:

S3 =M3

s3=

nXi=1

(xi � x)3

n � s3 (1.21)

Auch S3 nimmt f�ur linksschiefe Verteilungen positive und f�ur rechtsschiefe Verteilungennegative Werte an.

Beispiele:

1. Die H�au�gkeitsverteilung der Stichprobe mit den Ferkelzahlen in Bild 1.3 ist relativsymmetrisch. Deshalb liegen alle Schiefheitsma�e in der Umgebung von 0:

S1 =10:02� 10

2:197= 0:009

S2 =3 � (10:02� 10)

2:197= 0:027

S3 =183:321

100 � 2:1973 = 0:173

2. Die H�au�gkeitsverteilung der Stichprobe der Milchleistungen aus Tab. 1.8 ist eben-falls relativ symmetrisch. Da der Modus je nach Klasseneinteilung di�eriert, werdennur die Schiefheitsma�e S2 und S3 berechnet. Diese liegen nat�urlich auch in der Um-gebung von 0:

S2 =3 � (5188:7� 5231:5)

655:4= �0:196

S3 =�1130173824100 � 655:43 = �0:040

Page 35: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.2 Statistische Ma�zahlen eindimensionaler Stichproben 39

3. Die Verteilung der Bonituren in Bild 1.16 ist o�ensichtlich linksschief. Dies dr�ucktsich auch in den Schiefheitsma�en aus, die alle sehr viel gr�o�er als 0 sind:

S1 =3� 1

2:033= 0:984

S2 =3 � (3� 2)

2:033= 1:476

S3 =744

90 � 2:0333 = 0:984

4. Die Verteilung der Schlafzeiten in Bild 1.14 ist o�ensichtlich rechtsschief.

S1 =7:02� 7:33

1:196= �0:259

S2 =3 � (7:02� 7:20)

1:196= �0:452

S3 =�357:746150 � 1:1963 = �1:394

In diesem Fall gibt das Schiefheitsma� S3 die Rechtssteilheit am besten wieder.

1.2.14 Kurtosis oder Exze�

Symmetrische H�au�gkeitsverteilungen von Stichproben haben in vielen F�allen eineann�ahernd glockenf�ormige Gestalt, die man durch eine sog. Gau�sche Glockenkur-ve approximieren kann (vgl. Kap. 3.1). Das Histogramm der Ferkelzahlen in Bild 1.3besitzt z.B. eine solche Form.

Andere Verteilungen sind jedoch wesentlich spitzer. Bild 1.18 zeigt eine solche steil-gip ige Verteilung von Ferkelzahlen.

16151413121110987654

35

30

25

20

15

10

5

0

Ferkelzahl

abso

lute

Häu

figke

it

AAAAAAAAAAAA

AAAAAAAAAAAA

AAAAAA

AAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAA

AAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAA

AAAAAAAAAAAA

AAAAAAAAAAAA

AAAAAA

AAAAAAAAAAAA

AAAAAAAAAAAA

AAAAAA

AAAAAAAAAA

1013

10

19

31

22

8

3110

Bild 1.18: Steilgip ige Verteilung mit positiver Kurtosis

Im umgekehrten Fall kann die Verteilung auch breiter als eine Glockenkurve sein. Bild1.19 zeigt eine extrem achgip ige Verteilung von Ferkelzahlen.

Page 36: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

40 1 Beschreibende und explorative Statistik

16151413121110987654

35

30

25

20

15

10

5

0

Ferkelzahl

abso

lute

Häu

figke

it

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

000

1416

14

11

1617

12

000

Bild 1.19: Flachgip ige Verteilung mit negativer Kurtosis

Man verwendet zum Vergleich einigerma�en symmetrischer Verteilungen, die ann�a-hernd gleiche Streuung, aber unterschiedlicheW�olbung besitzen, dieKurtosis oder denExze�. Die W�olbung wird im wesentlichen erfa�t durch das auf x bezogene Moment 4.

Ordnung M4 =1

n

nXi=1

(xi � x)4, dividiert durch s4. Da f�ur die wichtige standardisierte

Normalverteilung mit glockenf�ormiger Gestalt (vgl. Kap. 3.1) diese Gr�o�e den Wert 3

hat, w�ahlt man als Kurtosis K einer Verteilung den Wert vonM4

s4�3, also die Di�erenz:

K =

nXi=1

(xi � x)4

n � s4 � 3 (1.22)

Die Kurtosis h�angt vom Moment M4 sowie der Standardabweichung s ab. Wenn z.B.eine Verteilung eine positive Kurtosis hat, so hei�t das in etwa, da� die Anzahl \gr�o�e-rer\ Abweichungen von x gr�o�er ist als bei einer Gau�schen Glockenkurve mit gleicherStreuung. Die Verteilung wird also eine spitzere Form aufweisen (Bild 1.18). Ganz ana-log wird im Falle einer negativen Kurtosis diese Verteilung eine stumpfere Form haben(Bild 1.19).

Beispiel:

Die Stichproben mit den Ferkelzahlen in den Bildern 1.3, 1.18 und 1.19 haben alle denMittelwert x = 10:02 und ungef�ahr die gleiche Standardabweichung. Die Kurtosis ist:

Bild 1.3 : K =7122:2

100 � 2:1974 � 3 = 0:057

Bild 1.18 : K =3240:3

100 � 1:6204 � 3 = 1:705

Bild 1.19 : K =2661:4

100 � 2:0004 � 3 = �1:337

Page 37: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.3 Beschreibung zweidimensionaler Stichproben 41

1.3 Beschreibung zweidimensionaler Stichproben

Es werden im folgenden zwei Merkmale X und Y betrachtet. Das Merkmal X soll mitden Auspr�agungen x1; x2; : : : xm, das Merkmal Y mit den Auspr�agungen y1; y2; : : : ynvorkommen. Zugelassen sind nominale, ordinale und quantitative Auspr�agungen, dieauch schon klassi�ziert sein k�onnen. Die Urliste einer zweidimensionalen Stichprobezeigt z.B. Tab. 1.2.

1.3.1 H�au�gkeitsverteilungen

Das allgemeine Schema einer zweidimensionalen H�au�gkeitsverteilung zeigt Tab.1.15.

y1 y2 : : : yj : : : yl R:H:

x1 n11 n12 : : : n1j : : : n1l n1:x2 n21 n22 : : : n2j : : : n2l n2:...

......

......

...xi ni1 ni2 : : : nij : : : nil ni:...

......

......

...xk nk1 nk2 : : : nkj : : : nkl nk:R:H: n:1 n:2 : : : n:j : : : n:l n

Tabelle 1.15: Zweidimensionale H�au�gkeitsverteilung als Kontingenztafel

Eine solche Tabelle wird auch als Kontingenztafel bezeichnet.

Die xi bzw. yi k�onnen im Falle quantitativer Daten diskrete Werte sein oder im Falleeiner gruppierten Verteilung auch Klassenmitten. nij gibt die absolute H�au�gkeit f�urdas Auftreten von Elementen mit der Auspr�agung xi bzgl. des x-Merkmals und mitder Auspr�agung yi bzgl. des y-Merkmals an. Interessiert nur die Verteilung der Merk-malswerte eines Merkmals, so braucht man die sog. Randh�au�gkeiten R.H. oderRandverteilungen.

Will man wissen, wie die x-Werte sich verteilen ohne R�ucksicht auf die y-Werte, dannmu� man in der obigen H�au�gkeitstafel die Zeilensummen bilden und erh�alt die Rand-verteilung bez�uglich x:

ni: =

lXj=1

nij (i = 1; 2; : : : ; k) (1.23)

Die Randverteilung von y ergibt sich aus den Spaltensummen:

n:j =

kXi=1

nij (j = 1; 2; : : : ; l) (1.24)

Page 38: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

42 1 Beschreibende und explorative Statistik

Beispiel:

Tab. 1.16 zeigt die Kontingenztafel f�ur die Anzahl der betriebseigenen Schlepper auf-geteilt nach Betriebs- und Schlepperleistungsklassen einer landwirtschaftlichen Region.

Betriebs- Schlepperleistung [kW]gr�o�e [ha] < 30 30� 50 50� 70 70� 90 > 90 R:H:

< 30 6 8 2 1630� 50 16 44 7 6750� 70 5 29 25 1 60> 70 5 2 7

R:H: 6 29 75 37 3 150

Tabelle 1.16: Kontingenztafel der Anzahl betriebseigener Schlepper aufgeteilt nachBetriebsgr�o�en- und Schlepperleistungsklassen

Die zweidimensionale H�au�gkeitsverteilung der Kontingenztafel in Tab. 1.16 zeigt Bild1.20.

<30 40 60 >700

5

10

15

20

25

30

<30

40

60

80

>90

Betriebsgröße [ha] Schlep

perle

istun

g [k

W]

abso

lute

Häu

figke

it

Bild 1.20: Zweidimensionale H�au�gkeitsverteilung der Anzahl betriebseigener Schlep-per aufgeteilt nach Betriebsgr�o�en- und Schlepperleistungsklassen

Die H�au�gkeiten k�onnen absolut (mit nij bezeichnet) oder relativ (mit hij bezeichnet)angegeben sein. Bei einer relativen H�au�gkeitsverteilung k�onnen jedoch die einzelnenH�au�gkeiten hij auf verschiedene Summen bezogen sein. Man kann sie erstens auf dieSpaltensummen, zweitens auf die Zeilensummen und drittens auf die gesamte Anzahln von untersuchten Elementen beziehen.

Beispiel:

Die M�oglichkeiten zur Darstellung der relativen H�au�gkeiten am Beispiel der Schlepperin Tab. 1.16 zeigen die Tab. 1.17 { 1.19.

Page 39: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.3 Beschreibung zweidimensionaler Stichproben 43

In Tab. 1.17 sind die Schlepperzahlen auf die Spaltensummen bezogen. Sie zeigt, wiesich Schlepper einer bestimmten Leistungsklasse auf einzelne Gr�o�enklassen der Be-triebe verteilen.

Betriebs- Schlepperleistung [kW]gr�o�e [ha] < 30 30� 50 50� 70 70� 90 > 90

< 30 100:0 27:6 2:730� 50 55:2 58:7 18:950� 70 17:2 38:7 67:6 33:3> 70 13:5 66:7

100 100 100 100 100

Tabelle 1.17: Relative H�au�gkeiten [%] der Schlepper in Tab. 1.16 bezogen auf dieRandh�au�gkeiten der Spalten

In Tab. 1.18 sind die Schlepperzahlen auf die Zeilensummen bezogen. Sie zeigt, wie sicheine bestimmte Betriebsgr�o�enklasse bei der Auswahl der Leistung ihres Schleppersverh�alt.

Betriebs- Schlepperleistung [kW]gr�o�e [ha] < 30 30� 50 50� 70 70� 90 > 90

< 30 37:5 50:0 12:5 10030� 50 23:9 65:7 10:5 10050� 70 8:3 48:3 41:7 1:7 100> 70 71:4 28:6 100

Tabelle 1.18: Relative H�au�gkeiten [%] der Schlepper in Tab. 1.16 bezogen auf dieRandh�au�gkeiten der Zeilen

Tab. 1.19 bezieht alle Schlepper in den einzelnen Gruppen auf die Gesamtzahl deruntersuchten Schlepper und stellt die eigentliche zweidimensionale Verteilung dar, dieVerteilung der Schlepper in Abh�angigkeit von den Leistungsklassen und den Betriebs-gr�o�enklassen.

Betriebs- Schlepperleistung [kW]gr�o�e [ha] < 30 30� 50 50� 70 70� 90 > 90

< 30 4:0 5:3 1:3 10:730� 50 10:7 29:3 4:7 44:750� 70 3:3 19:3 16:7 0:7 40:0> 70 3:3 1:3 4:7

4:0 19:3 49:9 24:7 2:0 100

Tabelle 1.19: Relative H�au�gkeiten [%] der Schlepper in Tab. 1.16 bezogen auf dieGesamtzahl der Schlepper

Page 40: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

44 1 Beschreibende und explorative Statistik

Es stellt sich die Frage, nach welcher Richtung (horizontal oder vertikal, d.h. Zeilen-summen oder Spaltensummen als Bezugsbasis) man die absoluten H�au�gkeiten pro-zentuieren soll. Wenn man in einer solchen Kreuztabellierung zwei Merkmale oder zwei\Faktoren\ zusammenbringt und man eindeutig einen Faktor als Ursache und denanderen als Wirkung betrachten kann, so ist es sinnvoll, in der Richtung des Ursa-chenfaktors zu prozentuieren. Wenn die Stichprobe, aus der die Kreuztabelle errechnetwird, jedoch nicht \repr�asentativ\1 ist, ist stets gro�e Vorsicht geboten, eine Ursache-Wirkungs-Relation auf eine Grundgesamtheit zu verallgemeinern. Zwei Merkmale oderFaktoren m�ussen auch nicht immer in einem direkten Ursache-Wirkungs-Verh�altnisstehen. Sehr h�au�g sind jedoch auch Merkmale in einer zweidimensionalen H�au�g-keitsverteilung miteinander verkn�upft, bei denen keine eindeutige Wirkungsrichtungvon einem Merkmal auf das andere festzustellen ist. So h�angen z.B. die MerkmaleBrustumfang und Kreuzh�ohe beim Rind voneinander ab (sie sind miteinander korre-liert), ohne da� man sagen k�onnte, die eine Variable ist Kausalursache f�ur die andere.Der Zusammenhang zwischen zwei solchen Merkmalen ist wechselseitig. F�ur das Fol-gende wird unterstellt, da� eine zuf�allige Stichprobe zugrundeliegt. Daraus wird einezweidimensionale, empirische H�au�gkeitsverteilung aufgestellt. In der Regel wird dabeivon der absoluten H�au�gkeitsverteilung ausgegangen.

1.3.2 Zusammenhang zweier Merkmale

In vielen F�allen kann man aus der H�au�gkeitsverteilung einer zweidimensionalen Stich-probe auf einen Zusammenhang zwischen zwei Merkmalen schlie�en (Bild 1.21).

<30 kW AAAAAAAA 30-50 kW

50-70 kWAAAAAAAAAAAA

70-90 kWAAAAAAAAAAAA

>90 kW

>70 ha50-70 ha30-50 ha<30 ha

80

70

60

50

40

30

20

10

0

Betriebsgröße

Rel

ativ

e H

äufig

keit

[%]

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAA AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAA AAAAAA AAAAAAAA

AAAA

Bild 1.21: Relative H�au�gkeitsverteilung der Schlepperleistung von Tab. 1.16 getrenntnach Betriebsgr�o�en

1Man benutzt gelegentlich nur eine Teilmenge aus einer endlichen Grundgesamtheit und zieht dieStichprobe dann aus dieser Teilmenge. In der Regel zeigt diese Teilmenge eine �ahnliche Struktur wiedie Grundgesamtheit. Man nimmt daher an, da� die Stichprobe repr�asentativ ist bzgl. der Grund-gesamtheit. Damit man diese Teilmenge aus einer endlichen Grundgesamtheit richtig ausw�ahlt, mu�man jedoch die Struktur der Grundgesamtheit gut kennen.

Page 41: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.3 Beschreibung zweidimensionaler Stichproben 45

Aus den Tabellen 1.17 � 1.19 wird deutlich, da� in gr�o�eren Betrieben tendenziell auchSchlepper mit h�oheren Leistungen vorkommen. Dies ist auch o�ensichtlich, wenn dierelativen H�au�gkeiten der Schlepperleistungsklassen innerhalb der jeweiligen Betriebs-gr�o�e f�ur jede Betriebsgr�o�e getrennt aufgetragen werden (Bild 1.21). Dies entsprichtden Werten in Tab. 1.18. Die relativen H�au�gkeiten innerhalb einer Betriebsgr�o�en-klasse addieren sich zu 100%.

Diese Abh�angigkeit zweier Merkmale kann man in einem zweidimensionalen Streu-

diagramm oder engl. Scatter Plot darstellen. Dabei tr�agt man die Me�werte jedesObjekts gegeneinander auf.

Beispiel:

Bild 1.22 zeigt das Streudiagramm von Betriebsgr�o�e und Schlepperleistung der ur-spr�unglichen Stichprobenwerte von Tab. 1.16.

8070605040302010

100

90

80

70

60

50

40

30

20

Betriebsgröße [ha]

Sch

lepp

erle

istu

ng [k

W]

Bild 1.22: Streudiagramm von Betriebsgr�o�e und Schlepperleistung

Es existiert o�ensichtlich eine positive lineare Abh�angigkeit der beiden Merkmale. DerZusammenhang ist jedoch nicht exakt linear, da die Me�werte mehr oder weniger umeine Gerade streuen.

Bild 1.23 zeigt vier verschiedene zweidimensionale Streudiagramme.

In Bild 1.23 a) ist der Zusammenhang zwischen den beiden Merkmalen streng linear,d.h. die Beobachtungen liegen exakt auf einer Geraden. Ein linearer Zusammenhangkann auch in Bild 1.23 b) angenommen werden, allerdings streuen dieWerte in gewissemUmfang um eine Gerade. Bei Bild 1.23 c) existiert kein Zusammenhang zwischen denMerkmalen. Die Beziehung ist mehr oder weniger zuf�allig. Schlie�lich ist in Bild 1.23 d)durchaus ein Zusammenhang zwischen den Merkmalen abzuleiten, allerdings ist diesero�ensichtlich nicht linear.

Page 42: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

46 1 Beschreibende und explorative Statistik

a)

r = �1

b)

r = 0:62

c)

r = 0

d)

(r = 0:91)

Bild 1.23: Streudiagramme zweier Merkmale mit verschiedenen Korrelationen

Eine Quanti�zierung der St�arke des linearen Zusammenhangs zweier Merkmale istmit der Korrelationsanalyse m�oglich. Dabei wird untersucht, ob zwei Merkmalevoneinander linear abh�angig, d.h. korreliert, oder linear unabh�angig, also unkorreliert,sind2.

Ein Ma� f�ur die St�arke des linearen Zusammenhangs soll weder vom Nullpunkt derMe�skalen noch von den Ma�einheiten der Merkmale X und Y abh�angen. Aus diesemGrund werden die Variablen X und Y auf den Mittelwert 0 und die Standardabwei-chung 1 skaliert.

Die Skalierung auf den Mittelwert 0 erfolgt durch die Bildung der Di�erenz der Stich-probenwerte xi bzw. yi minus den Mittelwerten x bzw. y. Haben die Di�erenzen xi�xund yi � y das gleiche Vorzeichen, so deutet dies auf einen positiven Zusammenhanghin. Ein negativer Zusammenhang wird durch verschiedene Vorzeichen der Di�erenzenangezeigt.

2Es erfolgt hier lediglich eine kurze Einf�uhrung in die Korrelationsanalyse. Eine umfassende Be-handlung beinhaltet Band 2.

Page 43: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.3 Beschreibung zweidimensionaler Stichproben 47

Die Summe

SPxy =

nXi=1

(xi � x)(yi � y) (1.25)

hei�t Summe der Abweichungsprodukte in Analogie zur Summe der Abwei-

chungsquadrate

SQx =

nXi=1

(xi � x)2 bzw. SQy =

nXi=1

(yi � y)2: (1.26)

Die Gr�o�e

sxy =1

n� 1

nXi=1

(xi � x)(yi � y) =1

n� 1SPxy (1.27)

hei�t Kovarianz zwischen X und Y .

Dividiert man die Di�erenzen xi�x und yi�y durch die jeweilige Standardabweichungsx bzw. sy, so erh�alt man die transformierten Variablen U und V , die den Mittelwert0 und die Standardabweichung 1 haben:

ui =xi � x

sx; vi =

yi � y

sy(1.28)

Der lineare Zusammenhang zwischen X und Y ist jetzt umso gr�o�er, je ausgepr�agterdie Tendenz ist, da� U und V entweder gleiches Vorzeichen oder ungleiches Vorzei-chen haben. Im ersten Fall spricht man von positivem linearen Zusammenhang bzw.positiver Korrelation, im zweiten Fall von negativem linearen Zusammenhang bzw.negativer Korrelation.

Das Produkt ui � vi ist ein einfaches Ma� f�ur die Tendenz bzw. den linearen Zusam-menhang zwischen xi und yi. Ein Ma� f�ur den linearen Zusammenhang der ganzenStichprobe ist das Mittel der einzelnen Betr�age, wobei in Analogie zur Berechnung der

Varianz nach Gleichung (1.7) anstatt durch n wieder durch n� 1 dividiert wird:

rxy =1

n� 1

nXi=1

ui � vi =1

n� 1

nXi=1

xi � x

sx� yi � y

sy(1.29)

rxy ist der empirische Korrelationskoe�zient zwischenX und Y . Dieser kann nachGleichung (1.28), (1.25) und (1.29) auch ausgedr�uckt werden als:

r = rxy =sxy

sx � sy=

SPxypSQx � SQy

(1.30)

Page 44: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

48 1 Beschreibende und explorative Statistik

Der Korrelationskoe�zient r kann Werte zwischen �1 und +1 annehmen. UnkorrelierteDaten haben einen Korrelationskoe�zienten von r = 0 oder nahe 0 (Bild 1.23 c). F�urjrj = 1 liegen die (xi; yi)-Werte im Streudiagramm exakt auf einer Geraden (Bild1.23 a). F�ur jrj < 1 streuen die Punkte mehr oder weniger um eine AusgleichsgeradeDer Datensatz in Bild 1.23 b) ist korreliert mit einem Koe�zienten von r = 0:62.Eine positive Steigung dieser Geraden liegt vor, wenn r > 0 ist (Bild 1.23 b). DieSteigung ist negativ f�ur r < 0 (Bild 1.23 a). Je gr�o�er r dem Betrag nach ist, destogeringer ist die Streuung um diese Ausgleichsgerade. F�ur die Stichprobe in Bild 1.23d) berechnet sich rein formal ein Korrelationskoe�zient von r = 0:91. Dieser ist jedochnicht interpretierbar, da der Zusammenhang nicht linear ist.

Beispiele:

1. F�ur den Spezialfall xi = yi f�ur alle Stichprobenwerte liegt eine extreme lineareAbh�angigkeit vor. Die Korrelation ist rxy = 1, denn es gilt:

SPxy =

nXi=1

(xi � x) � (yi � y) =

nXi=1

(xi � x)2 = SQx =

nXi=1

(yi � y)2 = SQy

Also folgt nach Gleichung (1.30) f�ur r:

rxy =SPxyp

SQx � SQy

=SPxyp

SPxy � SPxy

= 1

2. Wenn die Punkte exakt auf einer beliebigen Geraden yi = y0 +m � xi liegen, dannist yi � y = m � (xi � x) und es gilt nach Gleichung (1.27):

sxy =1

n� 1�

nXi=1

(xi � x) � (yi � y) =1

n� 1�m �

nXi=1

(xi � x)2 = m � s2x

Au�erdem gilt s2y = m2 � s2x. Der Korrelationskoe�zient ist deshalb:

rxy =m � s2x

sx � jmj � sx=

m

jmjF�ur m > 0 ist rxy = 1 und f�ur m < 0 ist rxy = �1. Ein Koe�zient bei einerGeraden mit der Steigung m = 0 ist nicht de�niert.

3. Der Korrelationskoe�zient zwischen der Betriebsgr�o�e und der Schlepperleistungin Bild 1.22 ist r = 0:78.

Page 45: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.3 Beschreibung zweidimensionaler Stichproben 49

Zur Berechnung von r per Hand emp�ehlt es sich, folgende Berechnungsformel zuverwenden, welche analog zur Berechnungsformel (1.9) f�ur die empirische Varianz her-geleitet werden kann:

r =SPxyp

SQx �pSQy

=

nXi=1

(xi � x) � (yi � y)

vuut nXi=1

(xi � x)2 �vuut nX

i=1

(yi � y)2

=

=

nXi=1

xi � yi �1

n�

nXi=1

xi

!�

nXi=1

yi

!vuut nX

i=1

x2i �1

n�

nXi=1

xi

!2

vuut nXi=1

y2i �1

n�

nXi=1

yi

!2

(1.31)

Es sind also folgende Summen mit einem Taschenrechner auszurechnen:

Xxi,X

x2i ,X

yi,X

y2i ,X

xiyi

An dieser Stelle sei nochmals an die Tatsache erinnert, da� bei einer Programmierungvon Gleichung (1.31) die Gefahr von \Stellenausl�oschung\ und damit gro�er Rundungs-fehler im Computer besteht, falls die beiden Ausdr�ucke im Z�ahler nahezu gleich gro�sind.

Beispiel:

Die folgende Tabelle zeigt die Baumh�ohe und den Stammdurchmesser von sechs Ka-stanienb�aumen.

Baumh�ohe [m] 12:3 10:1 5:4 2:6 14:1 7:3

Stammdurchmesser [cm] 31:9 30:2 15:7 10:0 40:9 23:1

Der Korrelationskoe�zient wird nach Gleichung (1.31) bestimmt:

i xi yi x2i y2i xiyi1 12:3 31:9 151:29 1017:61 392:372 10:1 30:2 102:01 912:04 305:023 5:4 15:7 29:16 246:49 84:784 2:6 10:0 6:76 100:00 26:005 14:1 40:9 198:81 1672:81 576:696 7:3 23:1 53:29 533:61 168:63P

51:8 151:8 541:32 4482:56 1553:49

r =1553:49� 51:8 � 151:8=6p

541:32� 51:82=6 �p4482:56� 151:82=6

= 0:98836 � 0:99

Page 46: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

50 1 Beschreibende und explorative Statistik

1.4 Beschreibung mehrdimensionaler Stichproben

Werden mehrere Merkmale f�ur eine Beobachtung gemessen, so erh�alt man multiva-

riate Daten. In Tab. 1.20 liegt z.B. eine Stichprobe von 20 Getreidesorten �uber dieMerkmale Ertrag, Tausendkorngewicht, Kornzahl pro �Ahre und P anzen pro Quadrat-meter vor.

Ertrag [dt/ha] TKG [g] Kornzahl/�Ahre P anzen/m2

76:0 46:7 43 42769:5 54:9 34 43065:0 56:0 37 36473:0 46:8 44 40369:1 47:6 43 38678:5 47:1 44 42672:3 48:6 38 44568:7 46:8 46 36675:7 41:3 41 49774:1 40:5 41 49964:2 52:9 35 40767:2 49:6 42 37365:6 52:0 38 38479:1 45:5 44 45074:7 49:5 41 41160:8 54:6 37 35271:8 50:7 40 39964:8 52:1 39 36964:5 51:5 45 32263:4 57:5 38 343

Tabelle 1.20: Ertragsmerkmale von 20 Getreidesorten

Allgemein hei�t ein Schema der Art

x11 x12 : : : x1j : : : x1mx21 x22 : : : x2j : : : x2m...

.... . .

......

...... xij

......

......

. . ....

xn1 xn2 : : : xnj : : : xnm

eine Datenmatrix, wobei xij der Wert des j-ten Merkmals bzw. der j-ten Variablenf�ur die i-te Beobachtung ist. Man sagt in diesem Fall, da� die Daten die Dimension

m haben. Eine Datenmatrix ist auch die grundlegende Struktur f�ur die Eingabe vonDaten in Statiskikprogrammen auf Computern. In Tab. 1.20 stehen die Daten jederSorte in den n = 20 Matrixzeilen, die Werte der einzelnen Merkmale stehen in denSpalten der Datenmatrix. Die Dimension der Daten betr�agt also m = 4.

Page 47: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.4 Beschreibung mehrdimensionaler Stichproben 51

1.4.1 H�au�gkeitsverteilungen

Ein H�au�gkeitsverteilung f�ur Datens�atze mit einer Dimension von m � 3 ist anschau-lich nicht mehr m�oglich, da mindestens 4 Dimensionen zur Darstellung ben�otigt werden.Man mu� sich auf die H�au�gkeitsverteilungen der Einzelmerkmale beschr�anken. Bild1.24 zeigt die Histogramme jedes einzelnen Merkmals der Tab. 1.20.

8075706560

40

30

20

10

0

Ertrag [dt/ha]

rela

tive

ufig

keit

[%]

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

6055504540

40

30

20

10

0

Tausendkorngewicht [g]

rela

tive

ufig

keit

[%]

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

45.042.540.037.535.0

30

20

10

0

Körner/Ähre

rela

tive

ufig

keit

[%]

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

500450400350300

30

20

10

0

Pflanzen/m2

rela

tive

ufig

keit

[%]

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

Bild 1.24: Histogramme der Ertragsmerkmale von 20 Getreidesorten

1.4.2 Streumatrizen

Streudiagramme wie bei zweidimensionalen Datens�atzen sind f�ur h�ohere Dimensionenebenfalls nicht mehr anschaulich darstellbar. Man tr�agt deshalb die Streudiagrammef�ur jeweils zwei Merkmale in einer Streumatrix oder einer Scatter-Plot-Matrix auf.Bild 1.25 zeigt die Streumatrix der Ertragsmerkmale von Tab. 1.20.

Das Merkmal Ertrag ist in der ersten Zeile der Streumatrix von Bild 1.25 als Ordinateund in der ersten Spalte als Abszisse abgetragen. In der zweiten Zeile bzw. Spalte istdie Ordinate bzw. Abszisse das Tausendkorngewicht. Entsprechendes gilt f�ur die dritteund vierte Zeile bzw. Spalte f�ur die Merkmale Kornzahl/�Ahre und P anzen/m2. Esgibt nun f�ur jedes Merkmal das Streudiagramm in Bezug auf alle anderen Merkmale.Bei den Darstellungen gegen�uber der Diagonalen, ist lediglich Abszisse und Ordinatevertauscht. Die Abbildungen sind also �aquivalent. Es existiert o�ensichtlich ein nega-tiver linearer Zusammenhang zwischen Tausendkorngewicht und Kornzahl pro �Ahre

Page 48: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

52 1 Beschreibende und explorative Statistik

74.525

65.375

53.25

44.75

43

37

74.52565.375

454.75

366.25

53.2544.75 4337

454.75366.25

Ertrag

TKG

Ko/Aehre

Pfl/m2

Bild 1.25: Streumatrix der Ertragsmerkmale von 20 Getreidesorten

sowie P anzen pro Quadratmeter. Eine Korrelation zwischen Kornzahl pro �Ahre undP anzen pro Quadratmeter ist nicht erkennbar. Zwischen Ertrag und P anzen pro Qua-dratmeter besteht eine deutlich positive Korrelation. Die positive Beziehung zwischenErtrag und Kornzahl pro �Ahre ist weniger stark ausgepr�agt. Auf den ersten Blick �uber-rascht die negative Beziehung zwischen Ertrag und Tausendkorngewicht. Betrachtetman jedoch die negative Korrelation des Tausendkorngewichts mit den anderen beidenertragsbildenden Merkmalen, dann ist klar, da� bei geringen Tausendkorngewichtendie Ertragsbildung im wesentlichen �uber die Kornzahl pro �Ahre und die P anzen proQuadratmeter erfolgt.

1.4.3 Zusammenhang mehrerer Merkmale

Die Streumatrix ist die graphische Variante einer Zusammenstellung der einfachenKorrelationen zwischen den beobachteten Merkmalen. Die Korrelationsmatrix istein Schema, das die Korrelationskoe�zienten zwischen jeder Variable enth�alt. F�ur dieMerkmale in Tab. 1.20 bzw. die Streumatrix in Bild 1.25 lautet die Korrelationsmatrix:

1:000 �0:756 0:484 0:764�0:756 1:000 �0:617 �0:7380:484 �0:617 1:000 0:0040:764 �0:738 0:004 1:000

Jedes Merkmal mit sich selbst ist nat�urlich zu r = 1 korreliert. Au�erdem sind Ko-e�zienten oberhalb der Diagonalen identisch mit Koe�zienten unterhalb davon. In-folgedessen kann die Korrelationsmatrix zum Dreiecksschema in Tab. 1.21 vereinfachtwerden:

Die Korrelationsmatrix in Tab. 1.21 best�atigt die Schlu�folgerungen aus der Streuma-trix in Bild 1.25 und gibt dar�uberhinaus quantitative Ma�e f�ur den linearen Zusam-menhang der Merkmale an.

Page 49: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.4 Beschreibung mehrdimensionaler Stichproben 53

Ertrag [dt/ha] TKG [g] Kornzahl/�Ahre

TKG [g] �0:756Kornzahl/�Ahre 0:484 �0:617P anzen/m2 0:764 �0:738 0:004

Tabelle 1.21: Korrelationsmatrix f�ur die Ertragsmerkmale in Tab. 1.20

1.4.4 Sterndiagramme

Mit Sterndiagrammen k�onnen im Prinzip beliebig viele Variablen dargestellt werden.Die Merkmale werden als Strahlen in verschiedene Richtungen der Ebene interpretiert.Die L�ange der Strahlen entspricht der Gr�o�e der Merkmalswerte. Da die Merkmalswerteals L�ange von Strahlen dargestellt werden, m�ussen sie alle positiv und etwa von gleicherGr�o�e sein. Aus diesem Grund werden die Werte jeder Variablen auf das Intervall[c; 1] skaliert, wobei c das Verh�altnis der L�angen des kleinsten und gr�o�ten Strahls ist.Bezeichnet xij den i-ten Me�wert der j-ten Variable, dann ist die skalierte Variablex�ij :

x�ij = (1� c) � xij �minj(xij )

maxj(xij)�minj(xij )+ c (1.32)

Wurden m Variablen gemessen, so w�ahlt man m Strahlen, die in m Richtungen derZeichenebene zeigen. Der Winkel � zwischen allen Strahlen ist gleich, also � = 360�=m.F�ur jedes beobachtete Objekt i wird ein Stern mit m Strahlen gezeichnet, deren L�angeden skalierten Merkmalswerten x�ij proportional ist.

Bild 1.26 zeigt das Sterndiagramm f�ur die Ertragsmerkmale von Tab. 1.20.

Bild 1.26: Sterndiagramm der Ertragsmerkmale aus Tab. 1.20

Page 50: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

54 1 Beschreibende und explorative Statistik

Jedes Merkmal wird in Bild 1.26 durch einen Strahl in vier verschiedene Richtungendargestellt. Der Winkel zwischen den Strahlen ist � = 360�=4 = 90�. Die Richtungist im Diagramm oben rechts f�ur die einzelnen Variablen angegeben. Je l�anger einStrahl innerhalb einer Variablen ist, desto gr�o�er ist der gemessene Stichprobenwertder Variablen.

Sterndiagramme erm�oglichen einen schnellen �Uberblick �uber Objekte, die in mehre-ren oder allen Merkmalen sehr gro�e oder sehr kleine Werte besitzen. Sorte 9 bringtbeispielsweise einen hohen Ertrag, der v.a. durch die Ertragskomponenten P anzenpro Quadratmeter und Kornzahl pro �Ahre bei geringem Tausendkorngewicht zustandekommt, w�ahrend bei Sorte 1 alle ertragsbestimmenden Komponenten an der Ertrags-bildung beteiligt sind. Dar�uberhinaus kann man auch bestimmte Gruppen erkennen,bei denen der Ertrag auf �ahnliche Weise gebildet wird. Sorte 1, 6 und 14 haben bei ho-hem Ertrag auch hohe Werte in allen drei ertragsbildenden Komponenten. Alle Sorten,die lediglich hohe Tausendkorngewichte aufweisen, wie z.B. 3, 11, 16 und 20, erreichennicht ann�ahernd die Ertr�age mit hohen Werten der beiden anderen Komponenten.Daraus kann man schlie�en, da� die Ertragsh�ohe vorwiegend durch die KomponentenP anzen pro Quadratmeter und Kornzahl pro �Ahre beein u�t wird.

Page 51: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.5 Explorative Statistik 55

1.5 Explorative Statistik

In den letzten Jahren fanden sog. explorative Methoden im Vorfeld einer statisti-schen Analyse immer mehr Verbreitung. Diese Methoden gehen �uber die bisher dar-gestellten Verfahren der beschreibenden Statistik hinaus und versuchen, vor allem mitgraphischen Hilfsmitteln die Daten augenf�allig und pr�agnant zu beschreiben und Be-sonderheiten bzw. Au��alligkeiten einer Stichprobe deutlicher darzustellen, als dies mitden klassischen Mitteln der beschreibenden Statistik m�oglich ist. Dar�uberhinaus kannman bei der Erforschung und der Suche nach Zusammenh�angen zwischen verschiedenenMerkmalen unabh�angig von restriktiven Verteilungsannahmen vorgehen. ExplorativeMethoden werden in diesem Zusammenhang auch als hypothesenerzeugende Me-

thoden bezeichnet, im Gegensatz zu den hypothesenbest�atigenden Methoden

der Inferenzstatistik. Die Vielfalt der explorativen Methoden, kurz EDA-Verfahrengenannt (ExploratoryData Analysis), geht auf Tukey zur�uck, der 1977 in seinem Buch\Exploratory Data Analysis\ eine gro�e Anzahl solcher Methoden erstmals umfassendvorstellte.

Hier sollen einige ausgew�ahlte Methoden als Erg�anzung des bisher gebrachten Instru-mentariums vorgestellt werden.

1.5.1 Stem-and-Leaf-Diagramme

Stem-and-Leaf-Diagramme oder Stamm-und-Blatt-Diagramme geben �ahnlichwie Histogramme die H�au�gkeitsverteilung einer Reihe von Beobachtungswerten wie-der. Allerdings gehen die numerischen Werte in individueller, augenf�alliger Weise indas Diagramm ein.

Die Konstruktion eines Stem-and-Leaf-Diagramms wird anhand einer Stichprobe �uberdas Gewicht von 25 Versuchspersonen in Bild 1.27 erl�autert. Die Merkmalswerte wer-den unter Ber�ucksichtigung eines Ma�stabfaktors und eventueller Rundung auf zweif�uhrende Zi�ern transformiert. Die erste Zi�er stellt die Stem-Zi�er, die zweite dieLeaf-Zi�er dar.

Stem Leaf4 95 45 686 36 555778897 113347 56798 018 7

Bild 1.27: Stem-and-Leaf-Diagramm der Gewichtsverteilung von Versuchspersonen

In der ersten, d.h. in der linken Spalte des Diagramms werden die Stem-Zi�ern derGr�o�e nach eingetragen, bei Bedarf mehrfach. In Bild 1.27 sind in dieser Spalte die

Page 52: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

56 1 Beschreibende und explorative Statistik

Zehner-kg abgetragen. Rechts von den Stem-Zi�ern werden die dazugeh�orenden Leaf-Zi�ern notiert, so da� waagrechte H�au�gkeitss�aulen mit den individuellen Leaf-Zi�ern(hier die Einer-kg), entstehen. Die dritte Zeile stellt also die Me�werte 56 kg und 58 kgdar. Das Stem-and-Leaf-Diagramm in Bild 1.27 enth�alt demnach neben der gesamtenInformation �uber die einzelnen Me�werte gleichzeitig die graphische Darstellung derH�au�gkeitsverteilung.

1.5.2 Letter-Value-Tabellen

Letter-Value-Tabellen dienen dazu, Beobachtungswerte summarisch durch Angabecharakteristischer Ma�zahlen (Letter-Values oder Buchstabenwerte) zu beschrei-ben. Solche Ma�zahlen sind derMedian (teilt die Datenreihe in 2 H�alften), die Quar-tile (teilt die Datenreihe in etwa 4 Viertel) und weitere Quantilswerte, welche mandurch fortgesetzte Halbierung der entsprechend geordneten Datenmenge erh�alt.

Bevor die Letter-Values de�niert werden, sind die Werte einer Beobachtungsreihe derGr�o�e nach zu ordnen. F�ur jeden Wert wird dann bestimmt, wie weit er vom oberenoder unteren Ende der geordneten Zahlenreihe entfernt ist. Damit ist die Tiefe t ei-nes Wertes gemeint, d.h. die Nummer der Position, welche bei demjenigen Ende derReihe mit 1; 2; : : : zu z�ahlen beginnt, welches dem betre�enden Wert n�aher ist. Diebeiden �au�ersten Werte, also der kleinste und der gr�o�te haben jeweils die Tiefe 1, derzweitkleinste und der zweitgr�o�te jeweils die Tiefe 2 usw.

Bei einer ungeraden Anzahl n von Werten gibt es einen tiefsten Wert, n�amlich denMedian oder den mittelsten Wert, kurz mit M bezeichnet. Seine Tiefe t(M) ist dannn+ 1

2. Bei einem geraden Stichprobenumfang, gibt es zwei mittelste Werte. Gew�ohnlich

sind diese Werte verschieden und keiner von ihnen teilt die Stichprobe exakt in zweiH�alften. �Ublicherweise nimmt man dann den Mittelpunkt zwischen den zwei mittelsten

Werten, von denen jeder die Tiefen+ 1

2� 1

2hat. Dieser Median spaltet also die Reihe

in zwei H�alften auf, und man kann nun wieder nach der Mitte dieser H�alften fragen,welche dann die sog. Hinges oder Fourth3 darstellen.

Die Tiefe der Hinges berechnet sich zu:

t(H) =

�[t(M)] + 1

�2

(1.33)

Mit [ ] ist die Entier-Funktion gemeint. [t(M)] bedeutet also die gr�o�te ganze Zahl,welche kleiner oder gleich t(M) ist.

Ist die berechnete Tiefe keine ganze Zahl, so nimmt man analog zum obigen Vorgehenbei der Festlegung des Medians in einem solchen Fall das arithmetische Mittel derbenachbarten Werte als Letter-Value. (vgl. folgendes Beispiel).

3Die Hinges bzw. die Fourth sind den Quartilen Q1 und Q3 (vgl. Bild 1.15) sehr �ahnlich. DieQuartilen Q1 und Q3 werden als Teilpunkte der Datenmenge so de�niert, da� 25% der Werte unterhalbvon Q1 bzw. 25% der Werte oberhalb von Q3 liegen. Die Berechnung der Hinges mit Hilfe des Begri�sder Tiefe ist dagegen etwas einfacher. Die Unterschiede zwischen Hinges und Quartilen sind gering.Es kann sein, da� die Hinges etwas n�aher als die Quartilen Q1 und Q3 beim Median liegen.

Page 53: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.5 Explorative Statistik 57

Man kann in dieser Weise fortfahren und mittlere Werte f�ur die beiden �au�eren Viertelder Stichprobe �nden. Diese Werte sind etwa ein Achtel der ganzen \L�ange" zwischenMaximum und Minimum von den beiden Enden der geordneten Reihen entfernt undsie werden daher auch Achtel genannt bzw. mit E wie Eighth abgek�urzt. Ihre Tiefeberechnet sich zu:

t(E) =

�[t(H)] + 1

�2

(1.34)

Die Letter-Values au�erhalb der Achtel-Werte werden seltener benutzt und habenkeine als Standard akzeptierten Namen. Sie werden eventuell mit den BuchstabenD;C;B;A; Z; Y; : : : bezeichnet.

Die n�achsten Letter-Values nach den Achtel-Werten w�aren die D-Werte und ihre Tiefe�ndet man mit:

t(D) =

�[t(E)] + 1

�2

(1.35)

Die beiden extremsten, also die �au�ersten Werte der Stichprobe haben die Tiefe t = 1.

Tab. 1.22 zeigt anschaulich, wie man die Letter-Values der Gewichtsstichprobe von Bild1.27 berechnet.

Die in Tab. 1.22 gefundenen Letter-Values werden i.a. in einer Tabelle �ubersichtlichzusammengestellt, wobei zusammengeh�orige Letter-Values (oberer und unterer Wert)zeilenweise notiert werden. Au�erdem wird der Mittelwert zusammengeh�orender Letter-Values (Mitte) und die Spannweite (Weite) zwischen diesen beiden Letter-Values an-gegeben.

Tab. 1.23 zeigt die zu den Gewichten in Bild 1.27 geh�orige Letter-Value-Tabelle.

Wenn die Mitten oder Mittelwerte ungef�ahr gleich sind, liegen die Letter-Values etwasymmetrisch um den Median. Wenn jedoch die H-, E-, D-Mitten usw. im Vergleichzum Median mehr nach der einen oder anderen Seite tendieren (also jeweils gr�o�er oderkleiner sind), deutet dies auf eine entsprechende Schiefe der Stichprobenverteilung hin.

Wie die Mitten werden auch die Weiten mit dem entsprechenden Letter-Value-Symbolversehen. Man spricht also von H-Weite, E-Weite usw. und von der Range oderder Spannweite, wenn die Di�erenz der Extremwerte gemeint ist.

Die Mitten dienen dazu, Abweichungen einer Stichprobenverteilung von der Symmetrie,also Schiefe, anzuzeigen.

Man m�ochte nun h�au�g Stichprobenwerte so transformieren, da� ihre Verteilung ei-ne symmetrische Gestalt erh�alt. Die Verwendung und die Beobachtung der oben ein-gef�uhrten Mitten ist dabei ein n�utzliches Hilfsmittel, die richtige Transformation derStichprobenwerte herauszu�nden.

Page 54: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

58 1 Beschreibende und explorative Statistik

Tiefenberechnung Tiefe Wert Letter-Value

1 50 Extremwert 50t(C) = (2 + 1)=2 = 1:5 C = 51:5

2 53t(D) = (4 + 1)=2 = 2:5 D = 56:5

3 60t(E) = (7 + 1)=2 = 4 4 60 E = 60

5 616 62

t(H) = (13 + 1)=2 = 7 7 62 H = 628 639 6310 6411 6412 65

t(M) = (25 + 1)=2 13 67 M = 6712 6811 6910 699 718 72

t(H) = 7 7 72 H = 726 735 75

t(E) = 4 4 79 E = 723 80

t(D) = 2:5 D = 80:52 81

t(C) = 1:5 C = 83:51 86 Extremwert 86

Tabelle 1.22: Berechnung der Letter-Values f�ur die Gewichte von Bild 1.27

Letter-ValueTiefe unterer oberer Mitte Weite

M 13 67 67H 7 62 72 67 10E 4 60 79 69:5 19D 2:5 56:5 80:5 68:5 24C 1:5 51:5 83:5 67:5 32

1 50 86 68 36

Tabelle 1.23: Letter-Value-Tabelle f�ur die Gewichte von Bild 1.27

Page 55: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.5 Explorative Statistik 59

1.5.3 Box-Plots

Box-Plots oder Schachtel-Plots stellen die wesentlichen summarischen Charakteri-stika einer Reihe von Beobachtungswerten graphisch sehr anschaulich dar.

Die f�unf Letter-Values Median, die beiden Hinges (bzw. Quartilen Q1 und Q3) sowiedie zwei Extremwerte werden in einen sog. Box-and-Whiskers-Plot gezeichnet. Diemittlere H�alfte der Werte, also vom oberen bis zum unteren Hinge wird durch einRechteck oder eine Box dargestellt. Der Median wird markiert, z.B. mit einem +-Zeichen oder mit einem Strich quer durch die Box. Von jedem Hinge bzw. von jedemEnde der Box aus wird eine Linie bis zum Extremwert bzw. zum �au�erstenWert gezogen(vgl. Bild 1.28). Auf diese Weise erh�alt man einen groben, aber schnellen �Uberblick �uberdie Stichprobe (Spannweite, Median, H-Weite, Symmetrie).

Bild 1.28 zeigt den Box-and-Whiskers-Plot f�ur die Gewichte aus Bild 1.27.

9080706050

Gewicht [kg]

Bild 1.28: Box-and-Whiskers-Plot der Gewichte aus Bild 1.27

Manchmal enthalten Stichproben Werte, die so extrem niedrig oder hoch sind, da� sienicht zur Stichprobe geh�orig erscheinen. Solche Werte nennt manAusrei�er. Ausrei�erk�onnen z.B. durch falsches Messen oder Notieren entstehen. Solche Fehler will manverst�andlicherweise korrigieren, bzw. wenn das nicht mehr m�oglich ist, wird man diesezweifelhaften Werte von der weiteren statistischen Untersuchung ausschlie�en. Nichtalle Ausrei�er m�ussen falsche Werte sein. Sie k�onnen nat�urlich auch sehr ungew�ohnlicheWerte in einer Stichprobe darstellen und man wird dann dem Grund ihres Auftretensganz besondere Aufmerksamkeit widmen. Um Ausrei�er explorativ zu erfassen, kannman folgenderma�en vorgehen (vgl. Tukey bzw. Vellemann/Hoaglin):

Page 56: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

60 1 Beschreibende und explorative Statistik

Ausgehend von den Hinges und der H-Weite de�niert man die inneren Z�aune (innerfences) als folgende Punkte:

untere innere Z�aune: unterer Hinge � 1:5 �H-Weiteobere innere Z�aune: oberer Hinge + 1:5 �H-Weite

(1.36)

Die �au�eren Z�aune (outer fences) sind de�niert als:

untere �au�ere Z�aune: unterer Hinge � 3 �H-Weiteobere �au�ere Z�aune: oberer Hinge + 3 �H-Weite

(1.37)

Wenn Stichprobenwerte au�erhalb der inneren Z�aune liegen, werden sie als au�en oderals �au�ere Werte bezeichnet, und Stichprobenwerte, die au�erhalb der �au�eren Z�auneliegen, werden als weit au�en oder als weit �au�ere Werte bezeichnet.

Die Werte auf jeder Seite des Medians, welche innerhalb der inneren Z�aune diesen amn�achsten liegen, werden als Adjacent-Werte oder Anrainer-Werte bezeichnet.

F�ur die Gewichte in Bild 1.27 waren die Hinges 62 kg und 72 kg (vgl. Tab. 1.23). DieH-Weite ist also 10 kg. Damit erh�alt man die inneren Z�aune zu 62� 1:5 � 10 = 47 und72+ 1:5 � 10 = 87 und die �au�eren Z�aune zu 62� 3 � 10 = 32 und 72+ 3 � 10 = 102. Diebeiden Extremwerte 50 und 86 liegen nicht au�en, sie sind in diesem Fall gleich denAnrainer-Werten.

Neben dem einfacheren Box-and-Whiskers-Plot verwendet man h�au�g den sog. Box-Plot. Er wird folgenderma�en konstruiert. Zuerst zeichnet man die Box von Hinge zuHinge mit Kennzeichnung des Medians, genauso wie im Box-and-Whiskers-Plot. Dannzeichnet man Linien auf beiden Seiten der Box, jedoch nicht bis zu den Extremwerten,sondern nur bis zu den Adjacent-Werten. �Au�ere Werte werden durch \�\ weit �au�ereWerte durch \�\ gekennzeichnet. Weil f�ur die Gewichte in Bild 1.27 die Extremwertegleich den Anrainer-Werten sind, sind Box-Plot und Box-and-Whiskers-Plot identisch(Bild 1.28).

Page 57: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.6 Beschreibende und explorative Statistik mit MINITAB 61

1.6 Beschreibende und explorative Statistik mit MINITAB

Die statistische Datenanalyse ist f�ur gro�e Datenmengen �au�erst rechenaufwendig. Ausdiesem Grund benutzt man heute Statistikprogramme auf Computern. Es existierenviele anwenderfreundliche Softwareprodukte f�ur Personalcomputer am Markt. Das Pro-grammsystem MINITAB ist ein preiswertes und einfach zu erlernendes Statistikpaket.In den folgenden Abschnitten werden einige Verfahren der beschreibenden und explora-tiven Statistik mit MINITAB durchgef�uhrt. In der Windows-Version kann man nahezualle statistischen Verfahren �uber die gra�sche Benutzerober �ache steuern. MINITABsetzt dann entsprechende Kommandos im Session-Fenster (Bild 1.29) ab, in dem auchdie Ergebnisse der Analyse ausgegeben werden. Da die Kommandos im Session-Fensterauch vom Benutzer nach der Eingabeau�orderung MTB > selbst eingegeben werdenk�onnen, erfolgt die Benutzung dieser Befehle auf Kommandoebene, was die Darstel-lung in den folgenden Abschnitten drastisch verk�urzt.

1.6.1 Datenformat und Dateneingabe

Die zu analysierenden Daten werden in MINITAB in Spalten c (von engl. column =Spalte) abgelegt. Auf die einzelnen Spalten kann entweder �uber die Spaltennummer,also c1, c2, c3 usw. oder �uber individuell vergebene Namen, z.B. 'Ertrag', 'N min','Ozongeh.' zugegri�en werden. Die Vergabe von Namen hat den Vorteil, da� man sichnicht merken mu�, welches Merkmal in welcher Spalte steht.

Der zu analysierende Datensatz kann entweder direkt in das Data-Fenster (Bild 1.29)geschrieben und mit Namen belegt oder aus einer ASCII-Datei eingelesen werden. Diefolgende Befehlssequenz liest den Datensatz von Tab. A.10 aus einer Datei KUEHE.DATvon der Festplatte in die Spalten c1 bis c8 in MINITAB ein.

MTB > read 'kuehe.dat' c1-c8

Entering data from file: kuehe.dat

120 rows read.

MTB > name c1 'Rasse' c2 'ML(kg)' c3 'Fett(%)' c4 'Eiw(%)'

MTB > name c5 'Fett(kg)' c6 'Gew(kg)' c7 'KH(cm)' c8 'BU(cm)'

MTB > save 'kuehe.mtw'

Saving worksheet in file: kuehe.mtw

MINITAB best�atigt das Einlesen von 120 Zeilen (rows). Anschlie�end werden vomBenutzer Namen f�ur die Spalten mit den das jeweilige Merkmal erkl�arenden Namenvergeben (vgl. Tab. A.10 im Anhang). Das resultierende Data-Fenster zeigt Bild 1.29.Der Datensatz wird als MINITAB-Arbeitsblatt mit dem save-Befehl abgespeichert.MINITAB f�ugt die Endung .MTW (von engl. Minitab Worksheet) auch automatischan den Dateinamen an und best�atigt die Speicherung. Es existiert nun eine DateiKUEHE.MTW, die durch das Kommando retrieve 'kuehe' nach einem Neustart wiedergeladen werden kann.

Page 58: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

62 1 Beschreibende und explorative Statistik

Bild 1.29: MINITAB Session- und Data-Fenster

1.6.2 Statistische Ma�zahlen

Der Befehl describe gibt einige wichtige statistische Ma�zahlen der angegebenen Spal-ten aus.

MTB > describe 'ML(kg)'

N MEAN MEDIAN TRMEAN STDEV SEMEAN

ML(kg) 120 5513.0 5503.0 5511.6 722.6 66.0

MIN MAX Q1 Q3

ML(kg) 4123.0 7002.0 4921.7 6140.2

Es werden Stichprobenumfang n = N, arithmetisches Mittel x = MEAN, der Zentralwertoder Median ex = MEDIAN, empirische Standardabweichung s = STDEV (engl. standarddeviation) und der Standardfehler des Mittelwerts sx = SEMEAN (engl. standard errorof mean) ausgegeben. F�ur TRMEAN (engl. trimmed mean) werden jeweils die 5% gr�o�tenund kleinsten Werte abgeschnitten und aus den restlichen 90% der Mittelwert berech-

Page 59: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.6 Beschreibende und explorative Statistik mit MINITAB 63

net. MIN und MAX sind jeweils die kleinsten und gr�o�ten Stichprobenwerte. Q1 und Q3

bezeichnen die erste und dritte Quartile.

Man kann die statistischen Ma�zahlen auch f�ur mehrere Spalten ausgeben.

MTB > describe c2-c8

N MEAN MEDIAN TRMEAN STDEV SEMEAN

ML(kg) 120 5513.0 5503.0 5511.6 722.6 66.0

Fett(%) 120 4.0208 4.0300 4.0231 0.2050 0.0187

Eiw(%) 120 3.5072 3.4950 3.5048 0.1966 0.0179

Fett(kg) 120 221.27 219.00 221.15 28.19 2.57

Gew(kg) 120 699.92 702.00 700.36 41.21 3.76

KH(cm) 120 141.99 142.00 142.06 4.97 0.45

BU(cm) 120 197.92 198.00 197.96 4.45 0.41

MIN MAX Q1 Q3

ML(kg) 4123.0 7002.0 4921.7 6140.2

Fett(%) 3.3200 4.4400 3.8800 4.1700

Eiw(%) 3.0600 4.0100 3.3900 3.6300

Fett(kg) 167.00 278.00 198.00 246.00

Gew(kg) 602.00 799.00 674.25 727.75

KH(cm) 129.00 158.00 139.00 145.00

BU(cm) 184.00 206.00 195.00 201.00

Die Bestimmung der Ma�zahlen f�ur die Rasse macht keinen Sinn, da es sich um einnominales Merkmal handelt. Es ist jedoch sinnvoll, die Anzahl der Tiere verschiedenerRasse aufzulisten.

MTB > table 'Rasse'

ROWS: Rasse

COUNT

1 40

2 50

3 20

4 10

ALL 120

Die Rassenverteilung ist also 40 Schwarzbunte, 50 Fleckvieh, 20 Braunvieh und 10Gelbvieh, was zusammen den Gesamtstichprobenumfang von 120 ergibt.

Wenn man die statistischen Ma�zahlen f�ur die Rassen getrennt ausgeben will, mu�nach dem describe-Kommando ein Strichpunkt eingegeben werden. MINITAB wartetdann auf ein Subkommando, das mit einem Punkt abgeschlossen werden mu�.

Page 60: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

64 1 Beschreibende und explorative Statistik

MTB > describe 'ML(kg)';

SUBC> by 'Rasse'.

Rasse N MEAN MEDIAN TRMEAN STDEV SEMEAN

ML(kg) 1 40 5990.2 6007.0 5988.9 267.9 42.4

2 50 4973.5 4959.0 4964.3 231.4 32.7

3 20 6464.5 6426.5 6472.6 319.7 71.5

4 10 4398.3 4275.5 4383.5 254.0 80.3

Rasse MIN MAX Q1 Q3

ML(kg) 1 5471.0 6566.0 5762.2 6171.0

2 4533.0 5715.0 4870.8 5115.2

3 5783.0 7002.0 6216.0 6737.5

4 4123.0 4792.0 4168.0 4644.0

Die mittlere Milchleistung von Schwarzbunten (1) und Braunvieh (3) liegt also imBereich von 6000 kg, w�ahrend Fleckvieh (2) und Braunvieh (4) im Bereich unter 5000 kgliegt.

1.6.3 H�au�gkeitsverteilungen

Der Befehl histogram liefert die H�au�gkeitsverteilung eines Merkmals.

MTB > histogram 'ML(kg)'

Bild 1.30 zeigt das von MINITAB erstellte Histogramm.

7000650060005500500045004000

40

30

20

10

0

ML(kg)

Fre

quen

cy

7000650060005500500045004000

40

30

20

10

0

ML(kg)

Fre

quen

cy

Bild 1.30: Histogramm der Milchleistung

Au��allig in Bild 1.30 ist die mehrgip ige Verteilung der Milchleistung. Dies wird jedochverst�andlich, wenn man beachtet, da� sich die Stichprobe aus mehreren Rassen mitunterschiedlicher mittlerer Milchleistung zusammensetzt.

Page 61: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.6 Beschreibende und explorative Statistik mit MINITAB 65

1.6.4 Stem-and-Leaf-Diagramme

Der Befehl stem-and-leaf erzeugt ein Stem-and-Leaf-Diagramm. Dieses wird nun f�urden Milcheiwei�gehalt erstellt.

MTB > stem-and-leaf 'Eiw(%)'

Stem-and-leaf of Eiw(%) N = 120

Leaf Unit = 0.010

2 30 69

9 31 3559999

17 32 03344589

31 33 11355567777999

60 34 00123334444455566677778889999

60 35 00001122222334444555678

37 36 0001133344556777778

18 37 2336678

11 38 05566799

3 39 56

1 40 1

MINITAB gibt die Meldung Leaf Unit = 0.010 aus. Das bedeutet, da� z.B. die bei-den Werte in der ersten Zeile als 3:06 und 3:09 zu interpretieren sind. In der erstenSpalte werden lediglich die Anzahl der Stichprobenwerte bis zum Median hochgez�ahltund anschlie�end wieder abgez�ahlt. Das Stem-and-Leaf-Diagramm ist recht informativ,da es einerseits die H�au�gkeitsverteilung und andererseits die Stichprobenwerte selbstzeigt.

1.6.5 Letter-Value-Tabellen

Der Befehl lvals erzeugt eine Letter-Value-Tabelle:

MTB > lvals 'Eiw(%)'

DEPTH LOWER UPPER MID SPREAD

N= 120

M 60.5 3.495 3.495

H 30.5 3.390 3.630 3.510 0.240

E 15.5 3.265 3.745 3.505 0.480

D 8.0 3.190 3.860 3.525 0.670

C 4.5 3.150 3.890 3.520 0.740

B 2.5 3.110 3.955 3.533 0.845

A 1.5 3.075 3.985 3.530 0.910

1 3.060 4.010 3.535 0.950

Es werden die Letter-Values mit ihren Tiefen (DEPTH), unteren (LOWER) und oberen(UPPER) Grenzen sowie deren Mitte (MID) ausgegeben. Die Weite (SPREAD) ist die Dif-ferenz zwischen oberem und unterem Letter-Value.

Page 62: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

66 1 Beschreibende und explorative Statistik

1.6.6 Box-Plots

Der Befehl boxplot erzeugt einen Box-Plot,

MTB > boxplot 'Eiw(%)'

4.0

3.9

3.8

3.7

3.6

3.5

3.4

3.3

3.2

3.1

3.0

Eiw

(%)

4.0

3.9

3.8

3.7

3.6

3.5

3.4

3.3

3.2

3.1

3.0

Eiw

(%)

Bild 1.31: Boxplot des Eiwei�gehalts

Die Verteilung besitzt rechts au�en einen Anrainer-Wert.

Beim boxplot-Befehl kann man die Merkmale nach Rassen getrennt darstellen.

MTB > boxplot 'ML(kg)'*'Rasse'

Bild 1.32 zeigt die einzelnen Verteilungen der Stichprobenwerte getrennt nach Rassenals Boxplot. Dabei werden die Rassenunterschiede in der Milchleistung deutlich.

4321

7000

6000

5000

4000

Rasse

ML(

kg)

4321

7000

6000

5000

4000

Rasse

ML(

kg)

Bild 1.32: Boxplots der Milchleistung getrennt nach Rassen

Page 63: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.6 Beschreibende und explorative Statistik mit MINITAB 67

1.6.7 Streudiagramme

Die Analyse des Zusammenhangs zwischen zwei Variablen erfolgt im einfachsten Falldurch eine Auftragung der einen Variablen �uber der anderen. Interessiert z.B. derZusammenhang zwischen Fettertrag in kg und Milchleistung, so kann man f�ur jedeuntersuchte Kuh deren Milchleistung auf der Abszisse und deren Fettmenge auf derOrdinate abtragen. Es entsteht dann eine Punktewolke im Streudiagramm bzw. ScatterPlot (Bild 1.33).

MTB > plot 'Fett(kg)'*'ML(kg)'

7000600050004000

280

230

180

ML(kg)

Fet

t(kg

)

7000600050004000

280

230

180

ML(kg)

Fet

t(kg

)

Bild 1.33: Streudiagramm von Fettmenge und Milchleistung

Es besteht o�ensichtlich ein linearer Zusammenhang zwischen der Fettmenge undMilchleistung. Dies ist einleuchtend, da eine h�ohere Milchmenge nat�urlich auch einenh�oheren Fettertrag zur Folge hat. Dar�uberhinaus wurde der Fettertrag in kg aus demProdukt von Milchleistung und Fettgehalt in % berechnet. Der Zusammenhang istjedoch nicht exakt linear, da durch den unterschiedlichen Fettgehalt der Milch eineStreuung verursacht wird. Au�erdem sind im Streudiagramm von Bild 1.33 auch wie-der die beiden Gruppen der Milchleistungen erkennbar.

1.6.8 Streumatrizen

H�au�g interessiert der Zusammenhang zwischen mehreren Merkmalen. Beispielsweiseist eine Abh�angigkeit zwischen Gewicht, Kreuzh�ohe und Brustumfang wahrscheinlich.Man kann nun jede Variable �uber der anderen in einem Streudiagramm auftragen.Eine Darstellung dieser Diagramme in einem einzigen Bild f�uhrt zur Streumatrix oderScatter Plot-Matrix (Bild 1.34).

Eine Streumatrix wird mit dem Kommando matrixplot erzeugt.

MTB > matrixplot 'Gew(kg)'-'BU(cm)'

Page 64: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

68 1 Beschreibende und explorative Statistik

749.75

651.25

150.75

136.25

749.75651.25

200.5

189.5

150.75136.25

200.5189.5

Gew(kg)

KH(cm)

BU(cm)

Bild 1.34: Streumatrix von Gewicht, Kreuzh�ohe und Brustumfang

Links oben steht das Gewicht in kg, d.h. die Abszisse der Einzelbilder in der 1. Spalteund die Ordinate der Einzelbilder in der 1. Zeile der Matrix sind mit dem Gewichtskaliert. Entsprechendes gilt f�ur die Kreuzh�ohe in Spalte und Zeile 2 sowie f�ur denBrustumfang in der 3. Spalte und Zeile.

Ein Zusammenhang ist f�ur alle drei Variablen in Bild 1.34 ersichtlich. Dies ist auchklar, da gr�o�ere Tiere in allen drei Merkmalen h�ohere Werte haben als kleinere.

1.6.9 Korrelationskoe�zienten und Korrelationsmatrix

Das correlate-Kommando berechnet den empirischen Korrelationskoe�zienten zwi-schen zwei Merkmalen.

MTB > correlate 'ML(kg)' 'Fett(kg)'

Correlation of ML(kg) and Fett(kg) = 0.921

Der Korrelationskoe�zient als Ma� f�ur die St�arke des linearen Zusammenhangs zwi-schen Milchleistung und Fettmenge betr�agt also r = 0:921. Dieser relativ hohe Wertbest�atigt die o�ensichtlich enge lineare Beziehung der Werte in Bild 1.33.

Der correlate-Befehl kann auch f�ur die Bestimmung der Korrelationskoe�zientenmehrerer Variablen verwendet werden und liefert dann die Korrelationsmatrix.

Page 65: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

1.6

Besch

reibendeundexplorativ

eStatistik

mitMIN

ITAB

69

MTB>correlatec2-c8

ML(kg)

Fett(%)

Eiw(%)Fett(kg)

Gew(kg)

KH(cm)

Fett(%)

-0.276

Eiw(%)

-0.228

-0.133

Fett(kg)

0.921

0.117

-0.286

Gew(kg)

-0.577

-0.150

0.026

-0.661

KH(cm)

-0.721

-0.011

0.094

-0.753

0.857

BU(cm)

-0.535

-0.045

0.131

-0.577

0.838

0.797

Ausdieser

Korrela

tionsm

atrix

istz.B

.ersich

tlich,da�dieMilch

leistungmitder

Fett-

mengein

kghoch

positiv

korreliert

ist,mitdem

Fettg

ehaltin

%jed

och

einenegativ

eKorrela

tionaufweist.

Esist

also

beih� oheren

Milch

mengen

einVerd

� unnungse�

ektim

Fettg

ehalterk

ennbar.Dadie

Fettm

engedasProduktausMilch

leistungundFettg

e-haltist,

wird

dieser

Verd

� unnungse�

ektbeim

Fettg

ehaltdurch

die

hoheMilch

menge

kompensiert.

1.6.10

Balkendiagramme

Balkendiagramme(en

gl.barcharts)

eignen

sichseh

rgutzurDarstellu

ngderH� au�g-

keitsv

erteilungnominaler

Merk

male.

DieAuftra

gungder

nominalen

Merk

malsa

uspr� a-

gungerfo

lgtanderAbszisse.

�Uberderjew

eiligen

Merk

malsa

uspr� agungwird

einBalken

gezeich

net,

dessen

H� oheder

H� au�gkeit

des

entsp

rechenden

Merk

malsentsp

richt.

ZurErstellu

ngein

esBalkendiagrammsin

MINITABdien

tder

Befeh

lchart.

MTB>chart'Rasse'

DieRassen

verteilu

ngder

K� uhe,dieaufSeite

63mitdem

table-Befeh

lerzeu

gtwurde,

zeigtBild

1.35alsBalkendiagramm.Dabeiist

zubeachten

,da�dienominalen

Merk

-maleanderAbszisse

belieb

igverta

usch

twerd

enk� onnen,dasie

nich

tinein

efestg

elegte

Reih

enfolgegebrachtwerd

enk� onnen,wiedasbeiordinalen

Merk

malen

der

Fallist.

43

21

50403020100

Rasse

Number Nonmissing of Rasse

43

21

50403020100

Rasse

Number Nonmissing of Rasse

Bild

1.35:Balkendiagramm

der

Rassen

verteilu

ngvonK� uhen

Page 66: 1 Besc hreib ende und explorativ e Statistik - web4.wzw.tum.de · 1.1 Besc hreibung eindimensionaler Stic hprob en 7 2. Eine zw eidimensionale Stic hprob e v om Umfang n =20 erh alt

70 1 Beschreibende und explorative Statistik

1.6.11 Kuchendiagramme

Eine Alternative zu den Balkendiagrammen sind die h�au�g verwendeten Kuchen-

diagramme (engl. pie charts). Der zugeh�orige Wert einer diskreten oder nominalenMerkmalsauspr�agung wird als Segment aus einem Kreis herausgeschnitten. Die Seg-mentgr�o�e ist proportional zur Gr�o�e dieses Werts bzw. der entsprechenden H�au�gkeit.

Kuchendiagramme werden mit dem Makro4 %pie erzeugt. Das entsprechende Kuchen-diagramm zum Balkendiagramm f�ur die Rassenverteilung von Bild 1.35 zeigt Bild 1.36.

MTB > %pie 'Rasse'

1 (40, 33.3%)

4 (10, 8.3%)

3 (20, 16.7%)

2 (50, 41.7%)

Pie Chart of Rasse

Bild 1.36: Kuchendiagramm der Rassenverteilung von K�uhen

4Ein Makro ist eine Folge von Befehlen, die in einer eigenen Datei abgespeichert sind und bei Aufrufdes Makros abgearbeitet werden. In MINITAB haben Makros die Dateierweiterung .MAC. Ihr Aufruferfolgt durch ein vorangestelltes %-Zeichen.