R-hjelp
til exercise 3.3 i BSS
#
Les dataene inn i en dataramme, gi navn
til variablene i datarammen og se p� dataene:
firms<-read.table("http://www.math.uio.no/avdc/kurs/STK4900/data/exer3_3.dat")
names(firms)<-c("mnd","size","type")
firms
# Kontroller at dataene svarer til de som er
gitt i oppgaven.
#
(merk at "mutual" er
kodet som 0 og "stock" som 1)
#
Gj�r variablene i datarammen tilgjengelige:
attach(firms)
#
Beregn ulike summariske m�l for variablene:
summary(firms)
#
Pass p� at du forst�r hva de summariske m�lene sier deg!
#
Lag plott (ved siden av hverandre)
av "mnd" mot hver av de to andre variablene.
#
For den numeriske kovariaten "size" lager vi et spredningsplott,
mens vi lager boksplott
#
for den kategoriske kovariaten "type":
par(mfrow=c(1,2))
plot(size,mnd)
boxplot(mnd~type)
par(mfrow=c(1,1))
# Hva ser du av plottene?
#
Gj�r innledende regresjonsanalyser med hver variabel for seg:
fit1<-lm(mnd~size)
fit2<-lm(mnd~type)
summary(fit1)
summary(fit2)
# Hvilken variabel forklarer alene mest av
variasjonen i bel�pene?
# Har variablene (alene) signifikant betydning?
#
I den siste regresjonsmodellen
har vi bare �n kategorisk kovariat.
#
Kunne vi testet
effekten av den p� en annen m�te?
Ville det gitt
noen forskjell?
#
Gj�r regresjonsanalyse med begge kovariatene samtidig:
fit3<-lm(mnd~size+type)
summary(fit3)
#
Hva sier denne modellen deg? Ser den bedre ut en den beste modellen med bare �n kovariat?
# Pr�v selv med modeller med andregrads ledd for size og/eller med interaksjon.