Lösungen Tests

install.packages("car")

library(car)

Prestige

row.names(Prestige)

attach(Prestige)

1) Geben Sie den Mittelwert, den Median und die Standardabweichung des mittleren Einkommens (income) über alle Berufe an

# Aufgabe 1

mean(income)

median(income)

sd(income)

install.packages("car")

library(car)

Prestige

row.names(Prestige)

install.packages("car")

library(car)

Prestige

row.names(Prestige)

install.packages("car")

library(car)

Prestige

row.names(Prestige)

install.packages("car")

library(car)

Prestige

row.names(Prestige)

install.packages("car")

library(car)

Prestige

row.names(Prestige)

install.packages("car")

library(car)

Prestige

row.names(Prestige)

install.packages("car")

library(car)

Prestige

row.names(Prestige)

install.packages("car")

library(car)

Prestige

row.names(Prestige)

1) Geben Sie den Mittelwert, den Median und die Standardabweichung des mittleren Einkommens (income) über alle Berufe an

install.packages("car")

library(car)

Prestige

row.names(Prestige)

attach(Prestige)

# Aufgabe 1

mean(income)

median(income)

sd(income)

# Aufgabe 2

cor(x=income,y=women)

cor.test(income,women)

## Je höher das Einkommen der Berufsgruppe, desto geringer der Frauenanteil

# Aufgabe 3

income_bc <- income[which(type=="bc")]

income_wc <- income[which(type=="wc")]

# Als Welch-Test unter der Annahme ungleicher Varianzen

t.test(income_bc,income_wc)

t.test(income_bc,income_wc,alternative="two.sided",mu=0,paired=FALSE,var.equal=FALSE)

# Als t-Test

t.test(income_bc,income_wc,alternative="two.sided",mu=0,paired=FALSE,var.equal=TRUE)

## das mittlere Einkommen unterscheidet sich bei einer Irrtumswahrscheinlichkeit von 5%

# nicht signifikant zwischen Arbeitern und Angestellten

# Aufgabe 4

## Man kann die Datentabelle ordnen ->

row.names(Prestige)[order(prestige,decreasing = T)]

## physicians haben das höchste Prestige

## zweiter Ansatz

berufe <- row.names(Prestige)

summary(prestige)

which(prestige==87.2)

berufe[24]

## dritter Ansatz

row.names(Prestige)[which.max(prestige)]

# Aufgabe 5

summary(

lm(formula = prestige ~ income + education, data = Prestige)

)

## Fast 80% der Varianz der AV (Prestige) kann mithilfe der beiden Faktoren

#Einkommen und Ausbildungszeit vorhergesagt werden. Sehr hoch!

# Aufgabe 6

## ANOVA: UV: type, AV: prestige

summary(

aov(formula=prestige~type,data = Prestige)

)

### das mittlere Prestige unterscheidet sich signifikant zwischen den

### drei definierten Berufsgruppen

# Aufgabe 7

## Chi-Quadrat-Test

beruf_klasse <- ifelse(women >=50, "Männerberuf", "Frauenberuf")

table(beruf_klasse)

chisq.test(x=table(beruf_klasse),p=c(.5,.5))

## Hypothese abgelehnt.

## Annahme, dass die Hälfte aller Berufe Frauenberufe sind wird

## verworfen

# Aufgabe 8

table(beruf_klasse,type)

chisq.test(table(beruf_klasse,type))

## Es gibt einen Zusammenhang zwischen den Variablen