STK1000: FØRSTE SETT MED OBLIGATORISKE OPPGAVER

Våren 2008

 

Oppgavesettet består av tre oppgaver. Deler av oppgave 1 skal du gjøre for hånd og ved hjelp av lommeregner, deler ved hjelp av MINITAB eller annen programvare. I oppgavene 2 og 3 skal du benytte MINITAB (eller lignende). I forbindelse med bruk av MINITAB kan du ha nytte av notatet Starthjelp i MINITAB (kalt "innføringsheftet" nedenfor). Det er tilgjengelig på hjemmesiden til kurset.

I den skriftlige besvarelsen av oppgavene skal du kort forklare hvordan de enkelte punktene er løst. Det er valgfritt om du vil skrive besvarelsen for hånd eller om du vil bruke et tekstbehandlingsprogram. Der du bruker MINITAB, må relevante utskrifter og plott legges ved eller limes inn i besvarelsen. Instruksjoner for utskrift fra MINITAB finner du i avsnitt 10 i innføringsheftet.

Obligen skal leveres med en egen forside som du finner her. Det er lov å samarbeide og å bruke alle slags hjelpemidler. Den innleverte besvarelsen skal imidlertid skrives av deg og gjenspeile din forståelse av stoffet. Er vi i tvil om at du virkelig har forstått det du har levert inn, kan vi be deg om en muntlig redegjørelse.

Besvarelsen leveres på instituttkontoret ved Matematisk Institutt i 7. etasje, Niels Henrik Abels hus (Matematikkbygningen).

Frist for innlevering er fredag 22. februar 2008 kl 14.30.


Oppgave 1

De tre første spørsmålene (a-c) skal besvares manuelt, dvs. for hånd eller ved hjelp av lommeregner.

Forskere ved MIT (Massachusetts Institute of Technology) har gjort forsøk med hormonet melatonin som innsovingsmiddel. 40 unge menn ble gitt en viss dose med melatonin og plassert i et mørkt rom midt på dagen. Tiden (i minutter) det tok før de sovnet er gitt på fil i tekst-format og Minitab-format. Til sammenligning kan vi opplyse at gjennomsnittlig innsovningstid for forsøkspersoner som fikk placebo (juksemedisin) var 15 minutter.

a) Del tidsaksen opp i passende delintervaller og tell opp antall observasjoner i hvert delintervall. Tegn for hånd et histogram for de 40 observasjonene. Kommenter histogrammets form, og eventuelle avvik fra hovedformen.

b) Finn gjennomsnitt og median i datasettet. Si litt om effekten av melatonin som innsovingsmiddel på bakgrunn av histogrammet og disse størrelsene.

c) Finn empirisk standardavvik og kvartilbredde ("interquartile range, IQR") for innsovingstidene. Hva gir disse to størrelsene uttrykk for?

d) Kopier observasjonene inn i et arbeidsark i MINITAB eller bruk Minitabfilen og lag et histogram (kommando: Graph -> Histogram; jfr. avsnitt 8.3 i innføringsheftet). Sammenlign med histogrammet du lagde i a).

e) Benytt MINITAB til å beregne gjennomsnitt, median, empirisk standardavvik og kvartilbredde (kommando: Stat -> Basic Statistics -> Display Descriptive Statistics; jfr. avsnitt 8.1 i innføringsheftet). Får du samme resultater som i punktene b) og c)? Kommenter eventuelle avvik.

f) Bruk MINITAB til å lage et boxplot over dataene. Beskriv og beregn kriteriet som ligger til grunn for at to observasjoner er markert med stjerne-symbol i plottet. Syns du disse observasjonene burde fjernes fra datasettet i videre analyser?




Oppgave 2

I denne oppgaven skal vi se på data som er samlet inn under et innføringskurs i statistikk ved et amerikansk universitet. Studentene i kurset gjennomførte et enkelt forsøk. Hver student noterte sin høyde og vekt og målte pulsen sin (under hvile). Så kastet hver av studentene en mynt. De som fikk krone løp på stedet i ett minutt, mens de som fikk mynt ble sittende stille i ett minutt. Så målte alle pulsen en gang til (for de som satt stille, er dette en måling til av pulsen under hvile). Dataene for de 92 studentene finnes som en Minitab-fil og som en vanlig tekstfil, som du må kopiere inn i et arbeidsark i MINITAB. På datafilen er det en linje for hver av de 92 studentene, der variablene i kolonnene har følgende betydning:
  • Pulse1:  Første pulsmåling (antall slag per minutt)
  • Pulse2:  Andre pulsmåling (antall slag per minutt)
  • Ran:        1=løp på stedet; 2=satt stille
  • Sex:        1=mann; 2=kvinne
  • Height:   høyde i inches (1 inch = 2,54 cm)
  • Weight:   vekt i pounds (1 pound =0,454 kg)
Når du har lastet dataene inn i MINITAB, registrerer du dine egne verdier for variablene Sex, Height og Weight i linje 93 i arbeidsarket (husk å regne om til hhv. inches og pounds). Mål pulsen din under hvile og registrer den som Puls1. Kast så et kronestykke. Hvis det viser krone, løper du på stedet i ett minutt. Hvis ikke sitter du stille ett minutt. Så måler du pulsen din igjen og registrer den som Puls2 i linje 93 i arbeidsarket. Skriv også inn din verdi for Ran (1 hvis du løp, 2 hvis du satt stille).

Med dette modifiserte datasettet:

a) Beregn enkle oppsummerende mål for variabelen Pulse1. Hvordan ligger din egen verdi i dette bildet?

b) Lag histogram og stilk-og-blad plott for den samme variabelen, og merk av din egen verdi (Stilk-og-blad-plott lages med Graph -> Stem-and-Leaf).

c) Lag et scatterplot med Pulse1 på x-aksen og Pulse2 på y-aksen, med forskjellige symboler for de som løp og de som ikke løp. Forklar hva plottet viser. Lag andre grafiske fremstillinger som viser effekten av aktivitet p� Pulse2.

d) Gjennomfør en regresjonsanalyse med vekt som responsvariabel og høyde som forklaringsvariabel. Forklar hva resultatene av regresjonsanalysen forteller deg. (Kommandoer: Stat -> Regression -> Regression og Stat -> Regression -> Fitted Line Plot.)

e) Forklar hva R-Sq (r-kvadrert) i utskriften betyr.




Oppgave 3

Denne oppgaven er essensielt oppgave 2.106 på side 186 i læreboka. De to datasettene i oppgave 2.106 (ett for kvinner og ett for menn) er fremkommet ved at man har latt et antall eliteløpere løpe på tredemølle ved bestemte hastigheter ('Speed', som her betraktes som forklaringsvariabel), og målt stegfrekvensen (antall steg per sekund) ved hver hastighet. Responsvariabel er gjennomsnittlig stegfrekvens for henholdsvis kvinnelige og mannlige løpere ('Stride rate'). En enkel måte å organisere dataene på i MINITAB er å lage seks kolonner: speed, stride rate kvinner, stride rate menn, en dobbelt så lang kolonne der speed ligger to ganger etter hverandre og en dobbelt så lang kolonne der stride rate for kvinner og stride rate for menn ligger etter hverandre. Til slutt lager du en kolonne med en kategorisk variabel som angir om individene i den sistnevnte kolonnen er kvinner eller menn. De tre første kolonnene må du skrive inn manuelt. De to neste kan du lage manuelt eller ved å bruke Data -> Stack -> Columns. Den siste kolonnen må du lage manuelt.

a) Plott først dataene for hastighet og stegfrekvens. Her lager du tre figurer: Først en der dataene plottes i samme figur, men med ulike plottesymboler for menn og kvinner, dernest en der det legges inn en felles regresjonslinje og til slutt en der det legges inn separate regresjonslinjer. Plottene kan du lage med kommandoen Graph -> Scatterplot. På bildet som kommer fram kan du spesifisere de tre typene av plott som er beskrevet ovenfor ved With Groups, With Regression og With Groups and Regression henholdsvis. Du trenger den sjette kolonnen, som identifiserer kvinner og menn, for å lage det første og siste av plottene.

b) Anta nå at du fikk dataene uten identifikasjon av kjønn. Beregn koeffisientene for minste kvadraters linje for alle dataene. Bruk de to kolonnene der dataene for kvinner og dataene for menn er slått sammen.

c) Lag plott av residualene fra linjen i punkt b) mot rekkefølgen av observasjonene og mot hastighet. Forklar hvordan det vises i plottet at dataene kommer fra to forskjellige grupper. Kommandoene er her Stat -> Regression -> Regression. Klikk på Graphs og be om å få plottet (i) residualene mot rekkefølgen av observasjonene og (ii) residualene mot hastighet.

d) Beregn så regresjonslinjer separat for hvert kjønn. Hva blir korrelasjonen mellom hastighet og stegfrekvens i hvert av tilfellene? Hva sier disse korrelasjonene om regresjonslinjene?

e) Lag plott av residualene fra hver av de to linjene fra punkt d) mot hastighet. Kommenter plottene!