STK1000: ANDRE SETT MED OBLIGATORISKE OPPGAVER

v�ren 2008

 

Det andre settet med obligatoriske oppgaver i STK1000 best�r av to oppgaver, og vil delvis gj�re bruk av dataene fra f�rste obligatoriske oppgavesett.

I den skriftlige besvarelsen av oppgavene skal du forklare hvordan de enkelte punktene er l�st, og du skal diskutere resultatene du kommer fram til (der dette er relevant). Det er valgfritt om du vil skrive besvarelsen for h�nd eller om du vil bruke et tekstbehandlingsprogram. Der du bruker MINITAB, m� utskrifter og plott inkluderes i besvarelsen.

Obligen skal leveres med en egen forside som du finner her. Det er lov � samarbeide og � bruke alle slags hjelpemidler. Den innleverte besvarelsen skal imidlertid skrives av deg og gjenspeile din forst�else av stoffet. Er vi i tvil om at du virkelig har forst�tt det du har levert inn, kan vi be deg om en muntlig redegj�reslse.

Besvarelsen leveres p� instituttkontoret ved Matematisk Institutt i 7. etasje, Niels Henrik Abels hus ("matematikkbygningen").

Frist for innlevering er fredag 25. april 2008 kl 14.30.

Oppgave 1

Tenk deg at du har et tilfeldig utvalg (SRS) av st�rrelse 25 fra en N(10,5)-fordelt populasjon.

a) Hvilken fordeling f�r gjennomsnittet i et slikt tilfeldig utvalg? Er det svaret du gir eksakt eller tiln�rmet? Begrunn.

Tenk deg s� at du har 50 slike tilfeldige utvalg, hvert p� st�rrelse 25. P� grunnlag av hvert av de 50 utvalgene er det mulig � finne 50 90% konfidensintervall for forventningsverdien i populasjonen(som vi her vet at er lik 10) ved � bruke formelen p� side 388 i l�reboka (du skal ikke gj�re dette forel�pig).

b) Hvor mange av de 50 konfidensintervallene forventer du vil inneholde den riktige verdien 10?

c) La Y v�re en stokastisk variabel som angir hvor mange av 50 slike konfidensintervall som inneholder den riktige verdien 10. Hvilken fordeling har Y? Svaret ditt m� begrunnes skikkelig!

Du kan bruke MINITAB til � simulere den situasjonen som er beskrevet innledningsvis i oppgaven:

  • F�rst trekker du 50x25 stokastiske variable som er uavhengige og N(10,5)-fordelte. Kommando: Calc > Random Data > Normal. Generer 25 rader med data og ta vare p� dem i kolonnene C1-C50. Tallene i en kolonne gir deg n� de 25 observasjonene i et tilfeldig utvalg, mens de 50 kolonnene gir deg de 50 utvalgene.
  • S� finner du et 90% konfidensintervall for hvert av de 50 utvalgene. Kommando: Stat > Basic Statistics > 1-Sample Z.

d) Utf�r kommandoene ovenfor og angi de 50 konfidensintervallene du f�r. Hvor mange av dem inneholder den riktige forventningen 10? Kommenter resultatet i lys av punkt c).

e) Bruk de samme simulerte dataene til � finne 50 99% konfidensintervall for forventningsverdien i populasjonen. Forklar hvorfor disse intervallene blir lenger enn intervallene i d). Hvor mange av de 50 intervallene inneholder n� den riktige forventningen 10? Hvor mange hadde du forventet?


Oppgave 2

Vi er interesserte i � finne ut om det er forskjell mellom kj�nnene n�r det gjelder hvilepuls. Til � unders�ke dette skal du bruke ditt modifiserte puls-datasett fra oppgave 2 i det f�rste obligatoriske oppgavesettet (se den oppgaven for detaljer). Siden vi er interessert i hvilepulsen, skal du i hele oppgaven konsentrere deg om variabelen Pulse1. Husk � legge inn 1 eller 2 for kj�nn i variabelen Sex i linje 93, som representerer deg selv.

a) Bruk kommandoen Stat > Basic Statistics > Display Descriptive Statistics til � finne gjennomsnittlig hvilepuls og empirisk standardavvik separat for kvinner og for menn.

b) Lag boksplot av pulsm�lingene for kvinner og for menn i samme figur, og forklar hvilke av st�rrelsene fra utskriften i punkt a) du kan finne igjen i boksplottene.

c) For � svare p� problemstillingen gitt f�rst i oppgaven, vil vi f�rst anta at den deskriptive oppsummeringen av Pulse1 for kvinner (Sex=2) gir den sanne forventningen for denne gruppen. Anta videre at standardavviket for begge grupper er 10.0 (slag per minutt). Formuler problemstillingen gitt f�rst i oppgaven som et hypotesetestingsproblem med nullhypotese og alternativ hypotese. Bruk resultatene fra punkt a) til � beregne testobservatoren slik den er gitt p� side 410 i l�reboka.

Presisering: Du skal teste om forventningen for menn er lik det observerte gjennomsnittet for kvinner uten � ta hensyn til usikkerhet i gjennomsnittet for kvinner. Til sist i oppgaven skal du ogs� ta hensyn til denne usikkerheten.

d) Finn P-verdien for testen. Forklar hvordan denne tolkes og hva resultatet av testen betyr.

e) Gj�r testen direkte ved hjelp av kommandoen Stat > Basic Statistics > 1-Sample z. Kontroller at resultatene blir de samme som de du fikk i punktene c) og d).
Du vil her bli n�dt til � lage et eget arbeidsark eller "worksheet" som kun inneholder data for gruppen best�ende av menn (
Sex=1). Dette kan du gj�re ved kommandoen Data > Split Worksheet. I boksen for "By variable" skriver du 'Sex'. Du f�r da delt opp arbeidsarket i to deler, en for kvinner og en for menn. I punktene f) og g) nedenfor bruker du den delen som svarer til menn.

f) Lag et konfidensintervall for forventningen til Pulse1 for menn. Ved � bruke sammenhengen mellom tester og konfidensintervall, hva blir resultatet av testen da?

g) � anta at standardavviket er kjent, er urealistisk. Bruk teorien i avsnitt 7.1 i l�reboka til � utf�re en test p� forventningen for gruppen av menn n�r du n� ikke forutsetter kjennskap til standardavviket. (Du kan her bruke kommandoen Stat > Basic Statistics > 1-Sample t i MINITAB)

Hvor mange frihetsgrader f�r denne testen?

Sammenlign konfidensintervallet du f�r n�r det ikke forutsettes kjent standardavvik med konfidensintervallet i punkt f).
Hva blir dine konklusjoner n�?

h) Antagelsen vi gjorde om at forventningen til Pulse1 for kvinner var kjent, er ikke riktig. Det er imidlertid mulig � teste om de to gruppene har forskjellig forventning uten � gj�re antagelser om at den ene er kjent. Teorien bak dette er beskrevet i avsnitt 7.2 i l�reboka.
I MINITAB kan du bruke kommandoen Stat > Basic Statistics > 2-Sample t for � utf�re en slik test. Du m� n� g� tilbake til det opprinnelige arbeidsarket som inneholder dataene for b�de kvinner og menn. Det f�r du fram ved � klikke p� Window i hovedmenyen og deretter markere arbeidsarket. I MINITAB har du en mulighet til � velge � anta at standardavvikene for de to gruppene er like eller ikke.
Utf�r testen ved hjelp av denne kommandoen b�de n�r du antar at standardavvikene er like og n�r du ikke gj�r det. Diskuter resultatene og spesielt forskjeller mellom de to testene.

Lykke til!