Institutt for statsvitenskap
MASTER I STATSVITENSKAP HØSTEN 2009
STV4020 − forskningsmetode og statistikk
Fredag 27. november 2009, 5 timer
Alle oppgaver skal besvares. De oppgitte prosentene indikerer hvor mye hver oppgave teller i den samlede vurderingen.
Obs! Start på nytt ark for hver oppgave slik at det blir lett å skille besvarelsen i en forskningsmetodisk del (oppgave 1-4) og en statistisk del (oppgave 5-7).
Oppgave 1 (12 %)
a) Gjør rede for Adcock og Colliers fire nivåer av begreper og mål. Velg et sentralt begrep i statsvitenskap og gi eksempler på de fire nivåene for dette begrepet.
b) Adcock og Collier skiller mellom tre typer validering: innholdsvalidering (content validation), sammenfallsvalidering (convergence/discrimination validation) og nomologisk validering (nomological/construct validation). Gjør rede for disse tre typene validering. Bruk begrepet du har diskutert under (a) som eksempel.
Oppgave 2 (8 %)
Gerring (2005) diskuterer 16 egenskaper ved kausalforklaringer som kriterier for å vurdere om en kausalforklaring er god og interessant. Gi en kort drøfting av hvordan de følgende fire egenskapene er nyttige for å vurdere en kausalforklaring (de engelske termene i artikkelen er oppgitt i parenteser):
1. spesifikasjon (specification)
2. fullstendighet (completeness)
3. enkelhet (parsimony)
4. uavhengighet eller eksogenitet (independence)
Oppgave 3 (15 %)
a) Gjør rede for least likely case som strategi for caseutvelging. Hvordan kan denne strategien bidra til å styrke grunnlaget for generalisering?
b) Alexander George og Andrew Bennett hevder at casestudier gir grunnlag for betinget generalisering (contingent generalisation). Definer dette begrepet og gjør kort rede for hva som skiller betinget generalisering fra statistisk generalisering.
c) John Gerring definerer prosessporing som “a style of analysis used to reconstruct a causal process that has occurred within a single case”. Hvordan kan prosessporing illustrere Gerrings tese om at casestudier skårer høyt på indre validitet, men lavere på ytre validitet? Illustrer kort med en tenkt studie av årsaker/drivkrefter bak en politisk beslutning (for eksempel innen utenrikspolitikk).
Oppgave 4 (15 %)
a) Gjør rede for hvorfor frafall (dvs. at svarprosentene ikke er 100) kan være problematisk i komparative surveyundersøkelser og diskuter ulike strategier for å løse problemene som frafallet kan bidra til i slike undersøkelser.
b) I kapitlet “Sampling and Estimation” i Cross-Cultural Survey Methods bruker forfatterne begrepene
1. utvelgingsramme (sampling frame)
2. standardstrategi (standard strategy)
3. designeffekt
4. effektiv utvalgsstørrelse (effective sample size)
Hva menes med disse begrepene?
c) Hva menes med ekvivalens i komparativ surveyforskning? Hva menes med begrepsekvivalens, strukturell (eller funksjonell) ekvivalens, måleenhetsekvivalens og fullskalaekvivalens?
Oppgave 5 (25 %)
Anta at det i forbindelse med skolevalgene ble gjennomført en undersøkelse av holdning til styreform (republikk/kongedømme). Elever fra 160 tilfeldig valgte skoler deltok i undersøkelsen. Analysene bygger på opplysninger fra 7100 elever og følgende variabler:
· Styreform (Y). Variabelen er en indeks på tilnærmet intervallnivå med skala fra -4 (foretrekker helt klart republikk) til 4 (foretrekker helt klart kongedømme).
· Kjønn (X1). Variabelen er kodet med 0 (mann) og 1 (kvinne).
· Politikk (X2). Politisk orientering er operasjonalisert med en enkelt indikator med skala fra 1 (svært venstreorientert) til 9 (svært høyreorientert).
Indeksen for styreform, som forventes å være endimensjonal, er opprettet på grunnlag av 4 indikatorer, en refleksiv målemodell og faktoranalyse. Faktorladningene fremgår av tabell 5.1.
Tabell 5.1. Faktorladninger
Indikatorer |
1 |
2 |
3 |
4 |
Faktorladning, F1 |
.77 |
.80 |
.73 |
.68 |
a) Gjør kort rede for og vis med to skisser forskjellen på en refleksiv og en formativ målemodell.
b) Beregn kommunaliteten til indikator 2, og tolk resultatet.
Det er gjennomført ols-regresjon med styreform som avhengig variabel og med kjønn og politisk orientering (sentrert) som uavhengige variabler. Modellen som analyseres, inkluderer også samspill mellom kjønn og politisk orientering. Noen resultater fra analysen er vist i tabell 5.2.
Tabell 5.2. Resultater fra ols-regresjon med samspill.
|
Konstant- ledd |
Kjønn |
Politisk orientering |
Samspill |
|
|
.21* |
-.03* 1) |
.70* |
-.33* |
|
SE( |
.03 |
.04 |
.07 |
.12 |
|
1) * indikerer at p < .05 |
2) SE står for Standard Error |
||||
c) Gjør kort rede både for hva det vil si å sentrere variabelen politisk orientering, og for hva som trolig er grunnen til at det er gjort her.
d) Hva blir konstantleddet når resultatene tolkes som en relasjon mellom styreform og politisk orientering, og hvordan kan dette konstantleddet tolkes?
e) Gjør kort rede for hva analysen viser når det gjelder effekten av politisk orientering.
Fordi undersøkelsen omfatter elever fra 160 tilfeldige skoler, er også flernivåanalyse benyttet. To modeller ble analysert og utvalgte resultater er gjengitt i tabell 5.3.
Tabell 5.3. Resultater fra flernivåanalyse.
f) Vis at ubetinget intraklassekorrelasjon er icc ≈ .18, og gjør kort rede for hva resultatet indikerer.
g) Redegjør kort for informasjonen som ligger i kovariansestimatet (modell 2).
Oppgave 6 (15 %)
Tabellen under (Tabell II, Buhaug, 2006) viser resultatene fra estimering av en logistisk (Model 1) og en multinomisk logistisk (Model 2) regresjonsmodell. Analyseenheten er land observert en gang for hvert år i perioden 1946–99. Avhengig variabel er utbrudd av borgerkrig (0: ikke utbrudd; 1: utbrudd). Borgerkriger klassifiseres i to kategorier: “territorial” eller “governmental”.
Uavhengige variable i de to modellene: “Democracy” og “Anocracy” er dummyvariable som representerer en kategorisk regimetypevariabel (“non-democracy” er referansekategori). “GDP per capita” er en kontinuerlig variabel som måler gjennomsnittsinntekt per innbygger (målt i 1000 dollar). “Oil exporter” er en dikotom variabel som sier om mer enn 1/3 av landets eksport er olje. “Country size” er størrelsen på landet i kvadratkilometer, log-transformert. “Ethnic fractionalization” er et mål på antall etniske grupper i landet. “Decay function” er en funksjon av tid siden tidligere borgerkrig i samme land.
a) Hvorfor bør man bruke logistisk (bi- eller multinomisk) regresjon når den avhengige variabelen er kategorisk?
b) Hva er fordelene ved å log-transformere en variabel som befolkning?
c) Diskuter sammenhengen mellom regimetype og log odds for borgerkrig basert på resultatene i modell 1.
d) Diskuter - basert på estimatene i begge modellene - om en multinomisk logistisk regresjonsmodell er å foretrekke her.
e) Diskuter sammenhengen mellom regimetype og log odds for de to typene borgerkrig basert på resultatene i modell 2.
f) Regn ut log odds for henholdsvis “territorial” konflikt versus ikke-konflikt og “governmental” konflikt versus ikke-konflikt for et landår hvor GDP per capita har verdien 2 og log landstørrelse har verdien 12 og alle andre variable har verdien 0.
Oppgave 7 (10 %)
Figur 7.1 viser verdier på to variable “rikdom” og “ressurs” målt for en rekke tidspunkter for to land. “Rikdom” representerer landets rikdom, og “ressurs” betydningen av naturressurser for økonomien. Punktene med runde symboler tilhører land 1, punktene markert med trekanter land 2. Den tykke linjen representerer regresjonslinjen som framkommer ved å estimere en vanlig lineær regresjon .......... på disse dataene (vi kaller denne for modell 1). Vi får estimatene ........... De to tynne linjene representerer de to regresjonslinjene som framkommer ved å estimere samme modell ............. separat for de to landene der k er en indeks som skiller de to landene fra hverandre.
Figur 7.1. Korrelasjonsdiagram for relasjonen mellom variablene rikdom og ressurs.
a) Diskuter om modellen
gir et riktig estimat for . Begrunn svaret.
b) Vi definerer en ny variabel som har verdi 1 hvis observasjon i tilhører land 2 og verdi 0 hvis observasjonen tilhører land 1. Vi estimerer så modellen
(vi kaller denne for modell 2). Les ut fra figuren fortegn og omtrentlig størrelse på estimatene for parametrene i modellen og diskuter eventuelle forskjeller fra estimatene for modell 1.
Figur 7.2. Residualplott for modell 1.
Figur 7.3. Residualplott for modell 2.
c) Figur 7.2 viser et plott av residualene fra modell 1 mot verdien for hver enhet på ressursvariabelen. Figur 7.3 viser samme plott for modell 2. Diskuter forskjellen på disse to residualplottene.
d) Anta at land 1 er et ikke-demokrati mens land 2 er et demokrati. Diskuter hva vi kan slutte om effekten av demokrati på rikdom på grunnlag av disse opplysningene.