Kan gebruikt worden ook voor andere vakken, omdat het uitleg bevat ove...
Vak
Onderzoekspracticum 2 (6471OP2)
18Documenten
Studenten deelden 18 documenten in dit vak
Universiteit
Universiteit Leiden
Studiejaar: 2012/2013
Geüpload door:
Anonieme student
Dit document is geüpload door een student, net als jij, die anoniem wil blijven.
Universiteit LeidenAanbevolen voor jou
- 22Oefentoets Onderzoekspracticum 2Onderzoekspracticum 2Overige100% (2)
- 8Samenvatting Onderzoekspracticum 2 boek "Introduction to the practice of statistics"Onderzoekspracticum 2Samenvattingen100% (3)
- 40Onderzoekspracticum 2 college-aantekeningen Universiteit LeidenOnderzoekspracticum 2College-aantekeningen100% (1)
Reacties
inloggen of registreren om een reactie te plaatsen.
Andere studenten bekeken ook
- OP 2 hoorcollege 1
- OZP 2 HC 1 deel 1 - deel 1 van het eerste hoorcollege
- OP 2 aantekeningen - aantekenignen colleges
- Onderzoekspracticum II
- Samenvatting OP2 - Introduction to the Practice of Statistics
- [Onderzoekspracticum 2] - College 1
Gerelateerde documenten
- Samenvatting OP2
- OP2 aantekeningen college 1
- Onderzoekspracticum 2 college-aantekeningen Universiteit Leiden
- Samenvatting Onderzoekspracticum 2 boek "Introduction to the practice of statistics"
- Onderzoekspracticum 2 Analysetechnieken
- Oefentoets Onderzoekspracticum 2
Preview tekst
F-toets
Om te toetsen of twee onafhankelijke steekproeven getrokken zijn uit normaal verdeelde populatiesmet dezelfde variantie wordt de F-toets gebruikt. De nulhypothese wordt in dit geval als eenverhouding geformuleerd, H 0 : σ 12 / σ 22 = 1. Als de nulhypothese waar is, heeft de toetsingsgrootheid,de verhouding van de steekproefvarianties, T = s 12 / s 22 , de F-verdeling.
De F-toets vindt zijn belangrijkste toepassingen in de variantie-analyse. Verder wordt de F-toetstoegepast om bij de t-toets voor onafhankelijke steekproeven de voorwaarde te toetsen, dat depopulaties waaruit de twee steekproeven afkomstig zijn gelijke varianties hebben. Een eenvoudigetoepassing is die bij de vergelijking van de precisie van twee analyse-methoden.
Voorbeeld. Voor de meting van de bloedstollingstijd zijn twee apparaten in de handel. Verschillen deapparaten in precisie? Met beide apparaten wordt 13 keer de stollingstijd gemeten van hetzelfdebloedmonster. De standaardafwijkingen zijn s 1 = 2 seconden voor apparaat 1 en s 2 = 2 secondenvoor apparaat 2. Apparaat 2 lijkt beter, maar het verschil tussen de standaardafwijkingen kan toevalligzijn.
De nulhypothese is dat de apparaten dezelfde precisie hebben, dus H 0 : σ 12 / σ 22 = 1. De verhoudingvan de steekproefvarianties is t = s 12 / s 22 = 2 2 / 2 2 = 1. De toetsingsgrootheid heeft de F-verdeling met ν 1 = ν 2 = 12 vrijheidsgraden. De overschrijdingskans van de gevonden waarde zoekenwe op: p = P(T > 1) = 0. Bij toetsen met de overschrijdingskans met tweezijdig alternatiefmoeten we deze p-waarde vergelijken met α / 2, waarin α de waarde van het gewenstesignificantieniveau is, meestal 0. Omdat p > 0 wordt de nulhypothese in dit voorbeeld nietverworpen.
Algemene toets van de regressie
De tabel van de ANOVA van de regressie in de computeruitvoer bevat ook de algemene toets van denulhypothese, dat er geen lineaire relatie is tussen de afhankelijk en de onafhankelijk variabele, dusdat in het lineaire regressiemodel H 0 : β = 0.
Voorbeeld. Aan zeven proefdieren wordt een diëet met verschillende gehaltes aan eiwit gevoerd. Detoenames van het lichaamsgewicht en het eiwitgehalte van het voer zijn in de tabel samengevat.
Regressie-analyse geeft voor de schattingen van de asafsnede en de helling van de regressielijn resp.b 0 = 190 en b = 3. De tabel van de ANOVA van de regressie geeft onder anderen de residuele
variantie, = 567 en de totale variantie van de waarnemingen, s 2 = 7661:
De verhouding van de gemiddelde kwadratensom van de regressie en die van de residuen geeft eentoetsingsgrootheid, die onder de nulhypothese de F-verdeling met 1 resp. n - 2 = 5 vrijheidsgradenheeft.
De waarde van de toetsingsgrootheid is hier F = 43135 / 567 = 76. De kritieke waarde vande F-verdeling voor α = 0 en 1 en 5 vrijheidsgraden zoeken we op (zie F-verdeling) en bedraagtF1,5,0 = 6. Deze waarde wordt door 76 ruimschoots overschreden, zodat de nulhypothesewordt verworpen. De overschrijdingskans is p = 0 overeenkomend met de tabelwaarde p =0, dit is p < 0.
ANOVA met multipele lineaire regressie
De modellen van de multipele lineaire regressie met dummy-variabelen zijn in feite equivalent met deovereenkomstige modellen van de variantie-analyse (analysis of variance, ANOVA)
De eenvoudigste variantie-analyse is ANOVA met één factor (one-way ANOVA), waarmee getoetstwordt of 3 of meer onafhankelijke steekproeven afkomstig zijn uit populaties met dezelfde
gemiddelden. Getoetst wordt dus de nulhypothese H 0 : μ 1 = μ 2 = ... = μp en het overeenkomstigeregressiemodel heeft p - 1 dummies:
Y = β 0 + β 1 D 1 + β 2 D 2 + ... + βp-1Dp-1 + ε
De categorische variabele met p categorieën, gecodeerd door p - 1 dummies, wordt in de variantie-analyse een factor genoemd.
Een stapje verder gaat ANOVA met twee gekruiste factoren, waarmee dezelfde nulhypothese wordtgetoetst, maar waarbij er twee categorische predictoren of factoren zijn. Het model voor twee factorenmet ieder drie categorieën, gecodeerd met twee groepen dummies, D 1 , D 2 en B 1 , B 2 , is al tamelijkingewikkeld:
Y = β 0 + β 1 D 1 + β 2 D 2 + β 3 B 1 + β 4 B 2 + ε
en wordt nog gecompliceerder als er interactie is tussen de twee factoren of als het aantal factorengroter is dan drie. De benadering van variantie-analyse via multipele lineaire regressie heeft dan geenmeerwaarde meer.
Het regressie-model van covariantie-analyse (analysis of covariance, ANCOVA) is onder categorischepredictoren in het regressie-model behandeld. Ook hiermee wordt de nulhypothese H 0 : μ 1 = μ 2 = ... =μp onderzocht, maar covariantie-analyse modelleert een mix van continue en categorische variabelen.In het eenvoudigse geval zijn dat één contine en één categorische predictor met p categorieën, delaatste gecodeerd door middel van p - 1 dummies:
Y = β 0 + β 1 X + β 2 D 1 + β 3 D 2 + β 4 D 3 + ... + βpDp-1 + ε
De benadering van deze en andere, meer gecompliceerde modellen vanuit de variantie-analyse biedtmeer mogelijkheden en is veelzijdiger dan die vanuit de regressie-analyse.