Deskriptive Kennwerte

In diesem Kapitel geben wir Ihnen eine Einführung zur deskriptiven Analyse in R. Sie können ergänzend die Videotutrials zu Testverfahren (1) - Deskriptive Analyse nutzen.



Häufigkeiten



Script


# Häufigkeitsanalyse


table(bsp01$sex)


Console


female male
58 42








Script


# Kategorisierung der Variable height in 2 Gruppen von 0 bis einschließlich 180 cm
# und größer als 180 cm (bis z. B. 250 cm, um einen Endpunkt festzulegen).

# Zur Verdeutlichung bezeichnen wir die Kategorien mit dem Argument labels.


height_kategorien <- cut(x=bsp01$height, breaks=c(0,180,250),
labels=c("kleiner/gleich 180 cm", "groesser 180 cm")
)


# Mehrdimensionale Tabelle aus Geschlecht und der kategorisierten Körpergröße


table(bsp01$sex, height_kategorien)


Console


height_kategorien
kleiner/gleich 180 cm groesser 180 cm
female 48 10
male 21 21








Script


# Relative Häufigkeiten für das Geschlecht


prop.table(table(bsp01$sex))


Console


female male
0.58 0.42








Script


# Aufsteigende Sortierung der Häufigkeitstabelle mit sort()


sort(table(bsp01$sex), decreasing=FALSE)


Console


male female
42 58





Lagemaße



Script


# Deskriptive Statistik der Daten aus Pedersen et al. (2002) für die Männer.


attach(pedersen)


# Auswahl der Männer


des_m <- subset(desired, sex=="male")


# Mittelwert der Männer (leichte Abweichungen zu den Originaldaten)


mean(des_m)


Console


[1] 7.883495








Script


# Der getrimmte Mittelwert ohne die oberen und unteren 10% der Daten


mean(des_m, trim=.1)


Console


[1] 3.722892








Script


# Der getrimmte Mittelwert ohne die oberen und unteren 25% der Daten


mean(des_m, trim=.25)


Console


[1] 2.45283








Script


# Median


median(des_m)


Console


[1] 1








Script


# 25%-Quantil und 75%-Quantil


quantile(des_m, probs=.25); quantile(des_m, probs=.75)


Console


25%
1
75%
6








Script


# Five-Number-Summary in der Reihenfolge:
# Minimum, 25%-Quantil, Median, 75%-Quantil, Maximum


fivenum(des_m)


Console


[1] 0 1 1 6 99








Script


# Zusammenfassung mit summary()


summary(des_m)


Console


Min. 1st Qu. Median Mean 3rd Qu. Max.
0.000 1.000 1.000 7.883 6.000 99.000





Streuungsmaße



Script


# Berechnung von Streuungsmaßen der Variable IQ.


attach(bsp01)


# Varianz und Standardabweichung des IQ


var(IQ); sd(IQ)


Console


[1] 266.9289
[1] 16.33796








Script


# Berechnung weiterer Streuungsmaße


IQR(IQ); range(IQ); max(IQ)-min(IQ)


Console


[1] 24.25
[1] 58 151
[1] 93








Script


# Ist eine Frau mit 183 cm Körpergröße relativ zu den anderen Frauen größer als ein
# Mann mit der Größe von 200 cm relativ zu den anderen Männern?

# Auswahl der Teilstichproben


height_male <- subset(height, sex=="male")
height_female <- subset(height, sex=="female")


# Mittelwerte der Körpergröße von Männer und Frauen


mean(height_male); mean(height_female)


Console


[1] 182.6279
[1] 164.0662





z-Standardisierung



Script


# z-Standardisierung


z_height_male <- scale(height_male)
z_height_female <- scale(height_female)


# Mittelwert und Standardabweichung z-Standardisierter Werte der Männer
# gerundet auf 4 Kommastellen mit der Funktion round()


round(mean(z_height_male),4) ; round(sd(z_height_male),4)


Console


[1] 0
[1] 1








Script


# Wie groß ist eine Frau von 182 cm relativ zu den anderen Frauen?


(182-mean(height_female))/sd(height_female)


Console


[1] 1.151743








Script


# Wie groß ist ein Mann von 200 cm relativ zu den anderen Männern?


(200-mean(height_male))/sd(height_male)


Console


[1] 1.077483