STK1000: FØRSTE SETT MED OBLIGATORISKE OPPGAVER
Våren 2008
Oppgavesettet består av tre oppgaver. Deler av oppgave 1 skal du gjøre for hånd og ved hjelp av lommeregner, deler ved hjelp av MINITAB eller annen programvare. I oppgavene 2 og 3 skal du benytte MINITAB (eller lignende). I forbindelse med bruk av MINITAB kan du ha nytte av notatet Starthjelp i MINITAB (kalt "innføringsheftet" nedenfor). Det er tilgjengelig på hjemmesiden til kurset.
I den skriftlige besvarelsen av oppgavene skal du kort forklare hvordan de enkelte punktene er løst. Det er valgfritt om du vil skrive besvarelsen for hånd eller om du vil bruke et tekstbehandlingsprogram. Der du bruker MINITAB, må relevante utskrifter og plott legges ved eller limes inn i besvarelsen. Instruksjoner for utskrift fra MINITAB finner du i avsnitt 10 i innføringsheftet.
Obligen skal leveres med en egen forside som du finner her. Det er lov å samarbeide og å bruke alle slags hjelpemidler. Den innleverte besvarelsen skal imidlertid skrives av deg og gjenspeile din forståelse av stoffet. Er vi i tvil om at du virkelig har forstått det du har levert inn, kan vi be deg om en muntlig redegjørelse.
Besvarelsen leveres på instituttkontoret ved Matematisk Institutt i 7. etasje, Niels Henrik Abels hus (Matematikkbygningen).
Frist for innlevering er fredag 22. februar 2008 kl 14.30.
Oppgave 1
De tre første spørsmålene (a-c) skal besvares
manuelt, dvs. for hånd eller ved hjelp av lommeregner.
Forskere ved MIT (Massachusetts Institute of Technology) har gjort forsøk med
hormonet melatonin som innsovingsmiddel. 40 unge menn ble gitt en viss dose
med melatonin og plassert i et mørkt rom midt på dagen. Tiden (i minutter)
det
tok før de sovnet er gitt på fil i
tekst-format og Minitab-format. Til sammenligning kan vi opplyse at
gjennomsnittlig innsovningstid for forsøkspersoner som fikk placebo
(juksemedisin) var 15 minutter.
a) Del tidsaksen opp i passende delintervaller og tell opp antall observasjoner i hvert delintervall. Tegn for hånd et histogram for de 40 observasjonene. Kommenter histogrammets form, og eventuelle avvik fra hovedformen.
b) Finn gjennomsnitt og median i datasettet. Si litt om effekten av melatonin som innsovingsmiddel på bakgrunn av histogrammet og disse størrelsene.
c) Finn empirisk standardavvik og kvartilbredde ("interquartile range, IQR") for innsovingstidene. Hva gir disse to størrelsene uttrykk for?
d) Kopier observasjonene inn i et arbeidsark i MINITAB eller bruk Minitabfilen og lag et histogram (kommando: Graph -> Histogram; jfr. avsnitt 8.3 i innføringsheftet). Sammenlign med histogrammet du lagde i a).
e) Benytt MINITAB til å beregne gjennomsnitt, median, empirisk standardavvik og kvartilbredde (kommando: Stat -> Basic Statistics -> Display Descriptive Statistics; jfr. avsnitt 8.1 i innføringsheftet). Får du samme resultater som i punktene b) og c)? Kommenter eventuelle avvik.
f) Bruk MINITAB til å lage et boxplot over dataene. Beskriv og beregn kriteriet som ligger til grunn for at to observasjoner er markert med stjerne-symbol i plottet. Syns du disse observasjonene burde fjernes fra datasettet i videre analyser?
Oppgave 2
I denne oppgaven skal vi se på data som er samlet inn under et innføringskurs i statistikk ved et amerikansk universitet. Studentene i kurset gjennomførte et enkelt forsøk. Hver student noterte sin høyde og vekt og målte pulsen sin (under hvile). Så kastet hver av studentene en mynt. De som fikk krone løp på stedet i ett minutt, mens de som fikk mynt ble sittende stille i ett minutt. Så målte alle pulsen en gang til (for de som satt stille, er dette en måling til av pulsen under hvile). Dataene for de 92 studentene finnes som en Minitab-fil og som en vanlig tekstfil, som du må kopiere inn i et arbeidsark i MINITAB. På datafilen er det en linje for hver av de 92 studentene, der variablene i kolonnene har følgende betydning:- Pulse1: Første pulsmåling (antall slag per minutt)
- Pulse2: Andre pulsmåling (antall slag per minutt)
- Ran: 1=løp på stedet; 2=satt stille
- Sex: 1=mann; 2=kvinne
- Height: høyde i inches (1 inch = 2,54 cm)
- Weight: vekt i pounds (1 pound =0,454 kg)
Med dette modifiserte datasettet:
a) Beregn enkle oppsummerende mål for variabelen Pulse1. Hvordan ligger din egen verdi i dette bildet?
b) Lag histogram og stilk-og-blad plott for den samme variabelen, og merk av din egen verdi (Stilk-og-blad-plott lages med Graph -> Stem-and-Leaf).
c) Lag et scatterplot med Pulse1 på x-aksen og Pulse2 på y-aksen, med forskjellige symboler for de som løp og de som ikke løp. Forklar hva plottet viser. Lag andre grafiske fremstillinger som viser effekten av aktivitet p� Pulse2.
d) Gjennomfør en regresjonsanalyse med vekt som responsvariabel og høyde som forklaringsvariabel. Forklar hva resultatene av regresjonsanalysen forteller deg. (Kommandoer: Stat -> Regression -> Regression og Stat -> Regression -> Fitted Line Plot.)
e) Forklar hva R-Sq (r-kvadrert) i utskriften betyr.
Oppgave 3
a) Plott først dataene for hastighet og stegfrekvens. Her lager du tre figurer: Først en der dataene plottes i samme figur, men med ulike plottesymboler for menn og kvinner, dernest en der det legges inn en felles regresjonslinje og til slutt en der det legges inn separate regresjonslinjer. Plottene kan du lage med kommandoen Graph -> Scatterplot. På bildet som kommer fram kan du spesifisere de tre typene av plott som er beskrevet ovenfor ved With Groups, With Regression og With Groups and Regression henholdsvis. Du trenger den sjette kolonnen, som identifiserer kvinner og menn, for å lage det første og siste av plottene.
b) Anta nå at du fikk dataene uten identifikasjon av kjønn. Beregn koeffisientene for minste kvadraters linje for alle dataene. Bruk de to kolonnene der dataene for kvinner og dataene for menn er slått sammen.
c) Lag plott av residualene fra linjen i punkt b) mot rekkefølgen av observasjonene og mot hastighet. Forklar hvordan det vises i plottet at dataene kommer fra to forskjellige grupper. Kommandoene er her Stat -> Regression -> Regression. Klikk på Graphs og be om å få plottet (i) residualene mot rekkefølgen av observasjonene og (ii) residualene mot hastighet.
d) Beregn så regresjonslinjer separat for hvert kjønn. Hva blir korrelasjonen mellom hastighet og stegfrekvens i hvert av tilfellene? Hva sier disse korrelasjonene om regresjonslinjene?
e) Lag plott av residualene fra hver av de to linjene fra punkt d) mot hastighet. Kommenter plottene!