STV4020 - Emne i forskningsmetode og statistikk høsten 2009

Institutt for statsvitenskap

MASTER I STATSVITENSKAP HØSTEN 2009

STV4020 − forskningsmetode og statistikk

Fredag 27. november 2009, 5 timer

Alle oppgaver skal besvares. De oppgitte prosentene indikerer hvor mye hver oppgave teller i den samlede vurderingen.

Obs! Start på nytt ark for hver oppgave slik at det blir lett å skille besvarelsen i en forskningsmetodisk del (oppgave 1-4) og en statistisk del (oppgave 5-7).

 

Oppgave 1 (12 %)

a)    Gjør rede for Adcock og Colliers fire nivåer av begreper og mål. Velg et sentralt begrep i stats­vitenskap og gi eksempler på de fire nivåene for dette begrepet.

b)   Adcock og Collier skiller mellom tre typer validering: innholdsvalidering (content validation), sammenfallsvalidering (convergence/discrimination validation) og nomo­logisk validering (nomological/construct validation). Gjør rede for disse tre typene validering. Bruk begrepet du har diskutert under (a) som eksempel.

Oppgave 2 (8 %)

Gerring (2005) diskuterer 16 egenskaper ved kausalforklaringer som kriterier for å vurdere om en kausal­forklaring er god og interessant. Gi en kort drøfting av hvordan de følgende fire egen­skapene er nyttige for å vurdere en kausalforklaring (de engelske termene i artikkelen er opp­gitt i parenteser):

1.    spesifikasjon (specification)

2.    fullstendighet (completeness)

3.    enkelhet (parsimony)

4.    uavhengighet eller eksogenitet (independence)

Oppgave 3 (15 %)

a)    Gjør rede for least likely case som strategi for caseutvelging. Hvordan kan denne strategien bidra til å styrke grunnlaget for generalisering?

b)   Alexander George og Andrew Bennett hevder at casestudier gir grunnlag for betinget generalisering (contingent generalisation). Definer dette begrepet og gjør kort rede for hva som skiller betinget generalisering fra statistisk generalisering.

c)    John Gerring definerer prosessporing som a style of analysis used to reconstruct a causal process that has occurred within a single case. Hvordan kan prosessporing illustrere Gerrings tese om at casestudier skårer høyt på indre validitet, men lavere på ytre validitet? Illustrer kort med en tenkt studie av årsaker/drivkrefter bak en politisk beslutning (for eksempel innen utenrikspolitikk).

Oppgave 4 (15 %)

a) Gjør rede for hvorfor frafall (dvs. at svarprosentene ikke er 100) kan være problematisk i komparative surveyundersøkelser og diskuter ulike strategier for å løse problemene som frafallet kan bidra til i slike undersøkelser.

b) I kapitlet “Sampling and Estimation” i Cross-Cultural Survey Methods bruker for­fatterne begrepene

1.    utvelgingsramme (sampling frame)

2.    standardstrategi (standard strategy)

3.    designeffekt

4.    effektiv utvalgsstørrelse (effective sample size)

Hva menes med disse begrepene?

c) Hva menes med ekvivalens i komparativ surveyforskning? Hva menes med begreps­ekvivalens, strukturell (eller funksjonell) ekvivalens, måleenhetsekvivalens og fullskala­ekvivalens?

Oppgave 5 (25 %)

Anta at det i forbindelse med skolevalgene ble gjennomført en undersøkelse av holdning til styreform (republikk/kongedømme). Elever fra 160 tilfeldig valgte skoler deltok i under­søkelsen. Analysene bygger på opplysninger fra 7100 elever og følgende variabler:

·      Styreform (Y). Variabelen er en indeks på tilnærmet intervallnivå med skala fra -4 (foretrekker helt klart republikk) til 4 (foretrekker helt klart kongedømme).

·      Kjønn (X1). Variabelen er kodet med 0 (mann) og 1 (kvinne).

·      Politikk (X2). Politisk orientering er operasjonalisert med en enkelt indikator med skala fra 1 (svært venstreorientert) til 9 (svært høyreorientert).

Indeksen for styreform, som forventes å være endimensjonal, er opprettet på grunnlag av 4 indikatorer, en refleksiv målemodell og faktoranalyse. Faktorladningene fremgår av tabell 5.1.

Tabell 5.1. Faktorladninger

Indikatorer

1

2

3

4

Faktorladning, F1

.77

.80

.73

.68

a)    Gjør kort rede for og vis med to skisser forskjellen på en refleksiv og en formativ måle­modell.

b)   Beregn kommunaliteten til indikator 2, og tolk resultatet.

Det er gjennomført ols-regresjon med styreform som avhengig variabel og med kjønn og politisk orientering (sentrert) som uavhengige variabler. Modellen som analyseres, inkluderer også samspill mellom kjønn og politisk orientering. Noen resultater fra analysen er vist i tabell 5.2.

Tabell 5.2. Resultater fra ols-regresjon med samspill.

 

Konstant­-

ledd

Kjønn

Politisk orientering

Samspill

 .21*

 -.03* 1)

 .70*

-.33*

SE( )2)

.03

.04

.07

.12

1) * indikerer at p < .05

2) SE står for Standard Error

           

c)    Gjør kort rede både for hva det vil si å sentrere variabelen politisk orientering, og for hva som trolig er grunnen til at det er gjort her.

d)   Hva blir konstantleddet når resultatene tolkes som en relasjon mellom styreform og politisk orientering, og hvordan kan dette konstantleddet tolkes?

e)    Gjør kort rede for hva analysen viser når det gjelder effekten av politisk orientering.

Fordi undersøkelsen omfatter elever fra 160 tilfeldige skoler, er også flernivåanalyse benyttet. To modeller ble analysert og utvalgte resultater er gjengitt i tabell 5.3.

Tabell 5.3. Resultater fra flernivåanalyse.

 

f) Vis at ubetinget intraklassekorrelasjon er icc ≈ .18, og gjør kort rede for hva resultatet indikerer.

g)   Redegjør kort for informasjonen som ligger i kovariansestimatet (modell 2).

Oppgave 6 (15 %)

Tabellen under (Tabell II, Buhaug, 2006) viser resultatene fra estimering av en logistisk (Model 1) og en multinomisk logistisk (Model 2) regresjonsmodell. Analyseenheten er land observert en gang for hvert år i perioden 1946–99. Avhengig variabel er utbrudd av borgerkrig (0: ikke utbrudd; 1: utbrudd). Borgerkriger klassifiseres i to kategorier: “territorial” eller “govern­mental”.

 

Uavhengige variable i de to modellene: “Democracy” og “Anocracy” er dummyvariable som representerer en kategorisk regimetypevariabel (“non-democracy” er referansekategori). “GDP per capita” er en kontinuerlig variabel som måler gjennomsnittsinntekt per innbygger (målt i 1000 dollar). “Oil exporter” er en dikotom variabel som sier om mer enn 1/3 av landets eksport er olje. “Country size” er størrelsen på landet i kvadratkilometer, log-transformert. “Ethnic fractionalization” er et mål på antall etniske grupper i landet. “Decay function” er en funksjon av tid siden tidligere borgerkrig i samme land.

a)    Hvorfor bør man bruke logistisk (bi- eller multinomisk) regresjon når den avhengige variabelen er kategorisk?

b)   Hva er fordelene ved å log-transformere en variabel som befolkning?

c)    Diskuter sammenhengen mellom regimetype og log odds for borgerkrig basert på resultatene i modell 1.

d)   Diskuter - basert på estimatene i begge modellene - om en multinomisk logistisk regre­sjons­modell er å foretrekke her.

e)    Diskuter sammenhengen mellom regimetype og log odds for de to typene borgerkrig basert på resultatene i modell 2.

f)    Regn ut log odds for henholdsvis “territorial” konflikt versus ikke-konflikt og “govern­mental” konflikt versus ikke-konflikt for et landår hvor GDP per capita har verdien 2 og log landstørrelse har verdien 12 og alle andre variable har verdien 0.

Oppgave 7 (10 %)

Figur 7.1 viser verdier på to variable “rikdom” og “ressurs” målt for en rekke tidspunkter for to land. “Rikdom” representerer landets rikdom, og “ressurs” betydningen av naturressurser for økonomien. Punktene med runde symboler tilhører land 1, punktene markert med trekanter land 2. Den tykke linjen representerer regresjonslinjen som framkommer ved å estimere en vanlig lineær regresjon .......... på disse dataene (vi kaller denne for modell 1). Vi får estimatene ........... De to tynne linjene representerer de to regresjonslinjene som framkommer ved å estimere samme modell ............. separat for de to landene der k er en indeks som skiller de to landene fra hverandre.

 

Figur 7.1. Korrelasjonsdiagram for relasjonen mellom variablene rikdom og ressurs.

a)    Diskuter om modellen 

 gir et riktig estimat for . Begrunn svaret.

b)   Vi definerer en ny variabel  som har verdi 1 hvis observasjon i tilhører land 2 og verdi 0 hvis observasjonen tilhører land 1. Vi estimerer så modellen 

 (vi kaller denne for modell 2). Les ut fra figuren fortegn og omtrentlig størrelse på estimatene for parametrene i modellen og diskuter eventuelle forskjeller fra estimatene for modell 1.

Figur 7.2. Residualplott for modell 1.

 

Figur 7.3. Residualplott for modell 2.

 

 

c)    Figur 7.2 viser et plott av residualene fra modell 1 mot verdien for hver enhet på ressurs­variabelen. Figur 7.3 viser samme plott for modell 2. Diskuter forskjellen på disse to resi­dual­plottene.

d)   Anta at land 1 er et ikke-demokrati mens land 2 er et demokrati. Diskuter hva vi kan slutte om effekten av demokrati på rikdom på grunnlag av disse opplysningene.

Publisert 27. juli 2015 13:42 - Sist endret 27. juli 2015 13:42