STK1000: ANDRE SETT MED OBLIGATORISKE OPPGAVER
v�ren 2008
Det andre settet med
obligatoriske oppgaver i STK1000 best�r av to oppgaver, og vil delvis gj�re
bruk av dataene fra f�rste obligatoriske oppgavesett.
I den skriftlige besvarelsen av oppgavene skal du forklare hvordan de enkelte
punktene er l�st, og du skal diskutere resultatene du kommer fram til (der
dette er relevant). Det er valgfritt om du vil skrive besvarelsen for h�nd
eller om du vil bruke et tekstbehandlingsprogram. Der du bruker MINITAB, m� utskrifter og plott inkluderes i besvarelsen.
Obligen skal leveres med en egen forside som du finner
her. Det er lov � samarbeide og � bruke alle slags hjelpemidler. Den innleverte besvarelsen skal imidlertid skrives av deg og gjenspeile din forst�else av stoffet. Er vi i tvil om at du virkelig har forst�tt det du har levert inn, kan vi be deg om en muntlig redegj�reslse.
Besvarelsen leveres p� instituttkontoret ved Matematisk Institutt i 7. etasje,
Niels Henrik Abels hus ("matematikkbygningen").
Frist for innlevering er fredag 25. april 2008 kl 14.30.
Oppgave 1
Tenk deg at du har et
tilfeldig utvalg (SRS) av st�rrelse 25 fra en N(10,5)-fordelt
populasjon.
a) Hvilken fordeling f�r gjennomsnittet i et
slikt tilfeldig utvalg? Er det svaret du gir eksakt eller tiln�rmet? Begrunn.
b) Hvor mange av de 50 konfidensintervallene
forventer du vil inneholde den riktige verdien 10?
c) La Y v�re
en stokastisk variabel som angir hvor mange av 50 slike konfidensintervall som
inneholder den riktige verdien 10. Hvilken fordeling har Y? Svaret
ditt m� begrunnes skikkelig!
Du kan bruke MINITAB
til � simulere den situasjonen som er beskrevet innledningsvis i oppgaven:
- F�rst trekker du 50x25 stokastiske variable som er uavhengige og
N(10,5)-fordelte. Kommando: Calc
> Random Data > Normal. Generer 25
rader med data og ta vare p� dem i kolonnene C1-C50.
Tallene i en kolonne gir deg n� de 25 observasjonene i et tilfeldig
utvalg, mens de 50 kolonnene gir deg de 50 utvalgene.
- S� finner du et 90% konfidensintervall for
hvert av de 50 utvalgene. Kommando: Stat > Basic Statistics
> 1-Sample Z.
d) Utf�r
kommandoene ovenfor og angi de 50
konfidensintervallene du f�r. Hvor mange av dem inneholder den riktige
forventningen 10? Kommenter resultatet i lys av punkt c). e) Bruk de samme simulerte dataene til �
finne 50 99% konfidensintervall for forventningsverdien i
populasjonen. Forklar hvorfor disse intervallene blir lenger enn intervallene
i d). Hvor mange av de 50 intervallene inneholder n� den riktige forventningen 10? Hvor mange hadde du forventet?
![endif]>![if>
Oppgave 2
Vi er interesserte i � finne
ut om det er forskjell mellom kj�nnene n�r det gjelder hvilepuls. Til
� unders�ke dette skal du bruke ditt modifiserte puls-datasett
fra oppgave 2 i det f�rste obligatoriske oppgavesettet (se den oppgaven for
detaljer). Siden vi er interessert i hvilepulsen, skal du i hele oppgaven
konsentrere deg om variabelen Pulse1. Husk � legge inn 1 eller 2 for kj�nn i variabelen Sex i
linje 93, som representerer deg selv.
a) Bruk kommandoen Stat > Basic Statistics > Display Descriptive
Statistics til � finne gjennomsnittlig hvilepuls
og empirisk standardavvik separat for kvinner og for menn.
b) Lag boksplot av pulsm�lingene for kvinner
og for menn i samme figur, og forklar hvilke av st�rrelsene fra utskriften i
punkt a) du kan finne igjen i boksplottene.
c) For � svare p� problemstillingen gitt
f�rst i oppgaven, vil vi f�rst anta at den deskriptive oppsummeringen av Pulse1 for
kvinner (Sex=2) gir den sanne forventningen for denne gruppen. Anta
videre at standardavviket for begge grupper er 10.0 (slag per minutt).
Formuler problemstillingen gitt f�rst i oppgaven som et hypotesetestingsproblem
med nullhypotese og alternativ hypotese. Bruk
resultatene fra punkt a) til � beregne testobservatoren slik den er gitt p�
side 410 i l�reboka.
Presisering: Du skal teste om forventningen for menn er lik det
observerte gjennomsnittet for kvinner uten � ta hensyn til usikkerhet
i gjennomsnittet for kvinner. Til sist i oppgaven skal du ogs� ta
hensyn til denne usikkerheten.
d) Finn P-verdien for testen. Forklar
hvordan denne tolkes og hva resultatet av testen betyr.
e) Gj�r testen direkte ved hjelp av
kommandoen Stat > Basic Statistics >
1-Sample z. Kontroller at resultatene blir de samme som de du fikk i
punktene c) og d).
Du vil her bli n�dt til � lage et eget arbeidsark
eller "worksheet" som kun inneholder data
for gruppen best�ende av menn (Sex=1). Dette kan du gj�re ved kommandoen Data >
Split Worksheet. I boksen for "By
variable" skriver du 'Sex'. Du f�r da delt opp arbeidsarket
i to deler, en for kvinner og en for menn. I punktene f) og g) nedenfor bruker
du den delen som svarer til menn.
f) Lag et konfidensintervall for
forventningen til Pulse1 for menn. Ved � bruke sammenhengen mellom tester og
konfidensintervall, hva blir resultatet av testen da?
g) � anta at
standardavviket er kjent, er urealistisk. Bruk teorien i avsnitt 7.1 i l�reboka
til � utf�re en test p� forventningen for gruppen av menn n�r du n� ikke
forutsetter kjennskap til standardavviket. (Du kan her bruke kommandoen Stat
> Basic Statistics > 1-Sample t i MINITAB)
Hvor mange frihetsgrader f�r denne testen?
Sammenlign konfidensintervallet du f�r n�r
det ikke
forutsettes kjent standardavvik med konfidensintervallet i punkt f).
Hva blir dine konklusjoner n�?
h) Antagelsen vi gjorde om at forventningen
til Pulse1 for kvinner var kjent, er ikke riktig. Det er
imidlertid mulig � teste om de to gruppene har forskjellig forventning uten �
gj�re antagelser om at den ene er kjent. Teorien bak dette er beskrevet i
avsnitt 7.2 i l�reboka.
I MINITAB kan du bruke kommandoen Stat > Basic Statistics > 2-Sample t for � utf�re en slik test.
Du m� n� g� tilbake til det opprinnelige arbeidsarket
som inneholder dataene for b�de kvinner og menn. Det f�r du fram ved � klikke
p� Window i hovedmenyen og deretter markere arbeidsarket. I MINITAB har du en
mulighet til � velge � anta at standardavvikene for de to gruppene er like eller
ikke.
Utf�r testen ved hjelp av denne kommandoen b�de n�r du antar at
standardavvikene er like og n�r du ikke gj�r det. Diskuter resultatene og
spesielt forskjeller mellom de to testene.
Lykke til!