6.3 en 7.1 - Data verzameling

In kader van een biologisch onderzoek, werd de lengte bepaald van 350 volwassen Komodovaranen.[br]De gegevens werden vervolgens weergegeven aan de hand van een histogram. Dit is een grafiek die de frequentieverdeling van numerieke gegevens visualiseert, door data te groeperen in 'klassen' (intervallen) en de hoogte van de staven de frequentie (=hoe vaak iets voorkomt) in die klasse weergeeft.
Wat doet de schuifknop bovenaan de histogram?
Het verzamelen van gegevens doen we niet zomaar.[br]We willen op basis van de gegevens voorspellingen gaan doen over de lengte van Komodovaranen in het algemeen. Om voorspellingen te kunnen doen, gaan we de data die we verzameld hebben, omvormen naar een kansverdeling. [br][br]We gaan daarvoor het histogram omvormen naar een [b]dichtheidshistogram[/b]:[br]Hierbij wordt op de verticale as (=y-as) de relatieve frequentiedichtheid (RFD) weergegeven ipv de frequentie:[br][math]RFD=\frac{frequentie}{totaal\cdot klassenbreedte}[/math][br][br]Door gebruik te maken van RFD, zorg je ervoor dat de totale oppervlakte van de grafiek = 1.[br]Je kunt nu de [b]dichtheidskromme[/b] tekenen, waarbij je de gemiddelde van elke klassen (en diens RFD) gaat verbinden met elkaar. Ook hier blijft de totale oppervlakte van de grafiek = 1.[br][br]De dichtheidskromme vormt daardoor een schatting voor de kansverdeling.[br][br][u]Ter info:[/u] De schuifknop (n) heeft net zoals hiervoor invloed op de klassenbreedte. In dit geval heeft dit dus niet te maken met het totaal aantal gegevens.
Hoe zou je de vorm van de bekomen grafiek beschrijven?
Regelmatig valt op dat meetwaarden vrij symmetrisch verdeeld zijn rond een centrale waarde.[br][br]We kunnen het dichtheidshistogram dan gaan benaderen door een klokvormige dichtheidskromme, genaamd de Gausscurve.[br][br]De Gausscurve wordt weergegeven via volgende functie (die je niet vanbuiten moet kennen):[br][math]f\left(x\right)=\frac{1}{\sigma\sqrt{2\pi}}\cdot e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}[/math][br][br]De Gausscurve is hierbij enkel afhankelijk van volgende parameters:[br][list][*]Het gemiddelde [math]\mu[/math][/*][*]De standaardafwijking [math]\sigma[/math][/*][/list][br]Als de vorm van de verdeling van een variabele X binnen een populatie overeenkomt met die van een gausscurve met parameters [math]\mu[/math] en [math]\sigma[/math], dan zeggen we dat de variabele [b]normaal[/b] [b]verdeeld[/b] is.[br]
Wat zou het voordeel zijn van een Gausskromme?
Wat zou een nadeel zijn van een Gausskromme?

8.2.2 De p-waarde bij een hypothesetoets

Oefening 11 p. 119
In een houtzagerij worden houten planken machinaal op maat gezaagd. [br]De lengte van de planken is normaal verdeeld met een gemiddelde van 250 cm en een standaardafwijking van 0,7 cm.[br][br]Na een aantal klachten van klanten heeft de klantendienst van het bedrijf het vermoeden dat de machine een fout vertoont, waardoor de planken te kort worden gezaagd.[br][br]Dat vermoeden wil het bedrijf nu onderzoeken.
Formuleer de nulhypothese bij het onderzoek.
Formuleer de alternatieve hypothese bij het onderzoek.
De klantendienst trekt een steekproef van 35 planken.[br]Noteer de parameters van het steekproefgemiddelde, ervan uitgaande dat de nulhypothese juist is. Rond af op 3 decimalen.
De onderzoekers vinden inderdaad een steekproefgemiddelde die kleiner is dan 250 cm, met name 249,7 cm.[br][br]Maar dit kan ook gewoon toeval zijn: de steekproef kon toevallig een paar kleinere planken bevatten. Hierdoor zal het steekproefgemiddelde iets lager liggen, zonder dat de machine te kleine planken snijdt.[br][br]De vraag is dus: wanneer gaan we ervoor kiezen om de nulhypothese te verwerpen.
Bereken mbv onderstaande applet hoe groot de kans was dat we een waarde [u]nog[/u] kleiner dan het gevonden steekproefgemiddelde zouden vinden.[br]Gezien we er op dit moment nog vanuit gaan dat de nulhypothese correct is, gebruik je voor de normale verdeling de parameters die je reeds hiervoor berekend hebt.
Duid de correcte bewering hieronder aan

Information