STK1000 - Høst 2020

Ukesoppgaver

Statistikk er et metodefag, og jeg anbefaler dere å jobbe med oppgaver jevnt gjennom semesteret. Å gjøre ukesoppgavene hver uke er en svært nyttig måte for deg til å forberede deg til eksamen, og er en viktig læringsaktivitet i emnet.

Ukenummeret henviser til hvilken uke det er tiltenkt at man kan få hjelp til å gjøre de respektive ukesoppgavene i gruppetimene. Legg merke til at det gruppetimer med fysisk oppmøte tirsdager, onsdager og torsdager og digitale gruppetimer både tirsdager og onsdager (se Timeplan). Gruppetimene er et uvurderlig tilbud, der dere kan få individuell veiledning i oppgaveløsning. For å sikre deg selv optimalt læringsutbytte, anbefaler jeg å gjøre et ærlig forsøk på å løse ukesoppgavene før du ber om hjelp fra gruppelærerne.

Ukesoppgaver for uke 46:
Fra læreboka: 11.1, 11.2, 14.11,14.13, 14.14

I tillegg: Vis at gjennomsnittet faktisk er en maximum likelihood-estimator for forventningen i en Normal fordeling, basert på n uavhengige, identisk fordelte
observasjoner x₁,x₂,..,x_n, NB! Da trenger du formelen for tetthetsfunksjonen til normalfordelinga, som du finner på side 57 i læreboka. La for enkelthets skyld standardavviket \(\sigma\) være kjent.
Tidligere eksamensoppgaver: Eksamen 2009 oppg. 2, Eksamen 2015 oppg. 3, Eksamen 2016 oppg. 3 (relatert til kap 11) og Eksamen 2018 oppg. 3 (relatert til kap 14)

Her finner du løsningsforslag til oppgavene for uke 46

Ukesoppgaver for uke 45:

-Fra læreboka, løs for hånd: 10.5, 10.6

-Fra læreboka, løs vha R: 10.48, 10.52
Her er dataene: https://www.uio.no/studier/emner/matnat/math/STK1000/h19/ex10-48ibi.txt

I tillegg: Eksamen 2012 oppgave 3, Eksamen 2018 oppgave 4

Her finner du løsningsforslag til oppgavene for uke 45

Ukesoppgaver for uke 44:

-Fra læreboka, løs for hånd: 7.71, 7.86, 10.2, 10.3, 10.4

-Fra læreboka, løs vha R: 7.126, 7.127

R-hint: funksjonen t.test() kan benyttes både for en populasjon, eksempelvis t.test(observasjoner_utvalg) eller t.test(observasjoner_utvalg, mu=verdi), og for to populasjoner t.test(observasjoner_utvalg1,observasjoner_utvalg2). Se også R-hint 2 uke 43.

Data til 7.126 finnes via lenka
https://www.uio.no/studier/emner/matnat/math/STK1000/h19/ex07-126paired.txt
-Tidligere eksamensoppgaver: Eksamen H-2004 oppg. 2, Eksamen V-2006 oppg 2 a,b,c, Eksamen V-2008 oppg. 2, Eksamen 2015 oppgave 3 a,b,c

Eksamensoppgavene finnes via lenka

https://www.uio.no/studier/emner/matnat/math/STK1000/oppgaver/

Her finner du løsningsforslag til oppgavene for uke 44

Ukesoppgaver for uke 43:

-Løs for hånd: 6.39, 6.46, 6.60, 6.72,6.94, 6.99, 6.108, 7.20, 7.34

-Løs vha R: 6.75*, 7.20e, 7.33 (data), 7.45 (data)

* Dataene leser du inn ved:
diff = c(5,6.5,-0.6,1.7,3.7,4.5,8,2.2,4.9,3,4.4,0.1,3,1.1,1.1,5,2.1,3.7,-0.6,-4.2) # sample
sigma = 3.0 # standard deviation

R-hint 1/2: Når standardavviket sigma er kjent, kan vi utføre hypotesetesten med funksjonen z.test, som befinner seg i pakken BSDA. Funksjonen beregner også 95 % konfidensintervall. Denne ferdig-funksjonen kan også
beregne konfidensintervall. R-kommandoer som følger:
install.packages("BSDA") # installerer programpakka
library("BSDA") # åpner/laster programpakka
z.test(diff, sigma.x = sigma) # utfører testen med data i vektoren diff og verdien på standardavviket i variabelen sigma

R-hint 2/2: Når standardavviket også skal estimeres fra data, kan konfidensintervall beregnes og hypotesetest utføres med
t.test(diff, conf.level = 0.95)

-Tidligere eksamensoppgaver: oppgave 2 fra avsluttende eksamen 2015, oppgave 1 fra avsluttende eksamen 2014
I de to eksamensoppgavene er det utskrift fra programvaren Minitab (ikke R) som skal tolkes, men det skal gå fint for denne gangen.

Her finner du løsningsforslag til oppgavene for uke 43

Ukesoppgaver for uke 42 (oppgaver fra læreboka):

-Løs for hånd: 6.15, 6.19, 6.20, 6.33, 6.36

-Løs vha R: 6.30, se R-hint og tilleggsoppgave under:
R-hint 6.30b: Les inn dataene ved kommandoen: mpg=c(41.5,50.7,36.6,37.3,34.2,45,48,43.2,47.7,42.2,43.2,44.6,48.4,46.4,46.8,39.2,37.3,43.5,44.3,43.3)
R-hint 6.30c: Følgende funksjon konfidens_intervall(x, sigma, level) kan brukes for beregning av konfidensintervall for forventningen når observasjonene ligger i vektoren x og standardavviket er kjent med verdi sigma. Level oppgis som 0.95, 0.99 etc.

konfidens_intervall = function(x, sigma, level){
n=length(x)
z=qnorm(1-(1-level)/2)
return(c(mean(x)-(z*sigma/sqrt(n)), mean(x)+(z*sigma/sqrt(n))))}

Tilleggsoppgave: I tillegg til 95%-konfidensintervallet du blir bedt om i oppgaven, lag også et 99% konfidensintervall. Hvorfor er 99%-konfidensintervallet bredere enn 95%-konfidensintervallet? Hvordan ville bredden av et 90% konfidensintervall vært i forhold, og hvorfor?

Her finner du løsningsforslag til oppgavene for uke 42

Ukesoppgaver for uke 40:

- Fra læreboka, løs for hånd: 5.28, 5.29, 5.35, 5.36, 5.37, 5.38, 5.60, 5.62 a), 5.64, 5.70, 5.72, 5.76, 5.77, 5.83

- Fra læreboka, løs vha R (bruk R i stedet for Tabell B): 5.27 +ekstra til slutt: gjenta b)-d) for n=100 og noter dine kommentarer.

- Oppgaver fra tidligere midtveiseksamener: Oppgavene 1, 2, 4, 5, 6, 7, 8 og 10 fra midtveiseksamen høsten 2009

Her finner du løsningsforslag til oppgavene for uke 40

Ukesoppgaver for uke 39:

- Fra læreboka, løs for hånd: 4.50, 4.51, 4.53, 4.58, 4.61, 4.71, 4.72, 4.73, 4.75, 4.76, 4.84, 4.87, 4.88, 4.105*, 4.106, 4.109, 4.112, 4.113, 5.8, 5.12
* tips: det kan være nyttig å tegne et Venn-diagram for å hjelpe intuisjonen
-Fra oppgaveark, løs ved hjelp av R **: 3.93 og 3.94

# Det tilhørende datasettet finnes her, og kan leses inn i R ved hjelp av kommandoene:
url = 'https://www.uio.no/studier/emner/matnat/math/STK1000/h18/csdata.txt'
data = read.csv(url, sep = '\t', dec = ',')

- Oppgaver fra tidligere midtveiseksamener: Oppgave 5 fra midtveis høsten 2008, oppgavene 9, 10, 15 og 17 fra midtveis høsten 2011 og oppgavene 11-15 fra midtveis høsten 2012

Her finner du løsningsforslag til oppgavene for uke 39

Ukesoppgaver for uke 38:

- Fra læreboka, løs for hånd: 3.34, 3.50, 3.55, 3.56, 4.6, 4.21, 4.25, 4.26, 4.28, 4.31, 4.35
- Oppgaver fra tidligere midtveiseksamener: Oppgave 10 fra midtveis våren 2006 og oppgavene 1-4 og 6-10 fra midtveis høsten 2008
- Fra læreboka, løs ved hjelp av R: 3.35 (bruk R for å løse (c)), 3.41 (bruk R for randomisering i (b)), 3.42 (bruk R for randomisering i (b)), 3.60 (bruk R for å trekke tilfeldig utvalg), 3.59 (bruk R for å trekke tilfeldig utvalg)

R-hint: Funksjonen «sample(x,n)» trekker et utvalg av n (unike) enheter fra vektoren x.
Til 3.59: "Datasettet" ligger ikke på bokens nettside, men du kan finne det her:
https://www.uio.no/studier/emner/matnat/math/STK1000/data/data_oppg_3-59.txt
Du kan laste det inn i R ved for eksempel å bruke kommandoen:
RESID <- scan("data_oppg_3-59.txt",what="character")

Her finner du løsningsforslag til oppgavene for uke 38

Ukesoppgaver for uke 37:

- Fra læreboka, løs for hånd:2.6, 2.32, 2.33, 2.50, 2.51
- Oppgavene 1-8 fra midtveiseksamen våren 2006: midtsemesteroppgaver vår 2006
- Fra læreboka, løs ved hjelp av R: 2.21*, 2.44*, 2.46, 2.66, 2.74**, 2.80, 2.81, 2.82
*presisering for oppgavene 2.21, 2.44: «highway fuel consumption»-variabelen heter «FuelConsHwy» i datasettet
**presisering for oppgave 2.74(a): finn predikerte verdier av "log count" for hver av de observerte verdiene av "Time", nemlig 1,3,5 og 7.

R-hint:

Funksjonen «plot(x,y)» kan blant annet brukes å lage spredningsplott for x og y
Funksjonen «cor(x,y)» returnerer korrelasjonen mellom x og y
Funksjonen «lm(y~x)» tilpasser linjen y=b0+b1*x ved minste kvadraters regresjon
Funksjonen «summary()» er ofte nyttig for å oppsummere resultatene fra en funksjon, for eksempel vil «summary( lm( y~x ) )» gi en nyttig oppsummering av resultatene for tilpasningen av minste kvadraters regresjons-linjen y=b0+b1*x. Mye av informasjonen den gir vil dere lære om senere. Uansett, nå kan dere lese av b0 og b1 derfra :)
For å legge til en enkelt ekstra observasjon med verdier y=25 og x=35 til datasettet fra oppgave 2.80 kan du for eksempel bruke kommandoene:
- data=read.csv("herliggerminCSVmappe/CSV/Chapter 2/EX02-080GENDATA.csv")
  n <- dim(data)[1]
  data[n+1,"y"] = 25
  data[n+1,"x"] = 35

Her finner du løsningsforslag til oppgavene for uke 37

Ukesoppgaver for uke 36:

-Fra læreboka, løs for hånd: 1.101, 1.102, 1.103, 1.110, 1.112, 1.114, 1.118, 1.121, 1.134
-Oppgave 1.120 fra 8.utgave av læreboka, løs for hånd:"Tidligere erfaringer med et gitt innføringsemne i statistikk antyder at poengsummene i faget kommer fra en fordeling som er tilnærmet normal med forventning 72 og standardavvik 10. Ti av studentene i faget fikk poengsummene 62, 93, 54, 76, 73, 98, 64, 55, 80 og 71, hhv, på eksamen.
a. Ved å bruke de oppgitte verdiene for forventning og standardavvik s, standardiser poengsummene til hver av disse 10 studentene.
b. Retningslinja er å gi karakter A til de studentene med poengsummer i topp 15% basert på normalfordelinga med forventning 72 og standardavvik 10. Hva er da grensa for karakter A i form av en standardisert poengsum?
c. Hvilke av de 10 studentene fikk karakter A i dette emnet?"
-Fra læreboka, løs ved hjelp av R: 1.142

Nyttige R-kommandoer for uke 36: qqnorm(), qqline()

Her finner du løsningsforslag til oppgavene for uke 36

Ukesoppgaver for uke 35 (fra læreboka):

-Løs for hånd: 1.4, 1.14 a+c, 1.17,1.27 a, 1.75,1.87
-Løs ved hjelp av R: 1.28, 1.30, 1.61, 1.72, 1.73, 1.88, 1.92

Noen nyttige R-kommandoer for uke 35:
barplot(), pie(), mean(), sd(), hist(), summary(), stem(), hist(), boxplot()
Du kan også slå opp i manualen med help(), feks help(barplot)

Her finner du løsningsforslag til oppgavene for uke 35

DATASETT:
Datasettene dere trenger for å løse R-oppgavene finner dere på nettsida til læreboka . Trykk på CSV under "Data Sets", så får du laste ned en zippet mappe "CSV" med mange CSV-filer. CSV-mappa er organisert med en undermappe per kapittel av boka, slik at dataene til oppgave 1.30 ligger som sti "CSV\Chapter 1\EX01-030KPOT40.csv" fra lokasjonen den zippede mappen ble pakket ut til.

Når du har lastet ned og pakket ut datasettene fra boka, kan du laste ønsket datasett inn i R vha beskrivelsen i Alternativ 2: Lese dataene fra en CSV-fil på din egen PC her

Publisert 10. aug. 2020 15:27 - Sist endret 27. aug. 2021 20:07