2TX Statistiek (old)

Uit Diana's examenwiki

Algemeen

Roby Roels

Geeft 7 lessen statistiek, heel erg enthousiast en aangenaam om les te volgen. Geeft een examen met twee vragen: een schriftelijke uit hoofdstuk 1 tot 3 en een mondelinge vraag uit hoofdstuk 4 tot 6. Tijdens het jaar wordt er aandacht besteed aan het uitwerken van de oefeningen door gebruik te maken van Excel. Op het examen is dit ook beschikbaar, je moet slechts aantonen welke functies je dan gebruikt hebt. Het mondeling verloopt heel relaxt, je krijgt nog een beetje hulp bij de schriftelijke vraag als het nodig is en hij geeft wat hints als je op het mondeling niet meer specifiek alles weet. Daarnaast zijn er ook nog 2 kleine bijvraagjes.

Augustus 2012

Reeks 2,  Roels

Vraag 1
Printerfabrikant HashPee verkoopt printers, maar deze bevatten heel wat kalibratiefouten. Zo is het dat wanneer in Word een lijn van 25cm wordt afgedrukt, de afgedrukte lijn altijd groter of kleiner is dan 25cm. Je kan stellen dat de lengte van deze lijnen normaal verdeeld is met een gemiddelde van 24.85 en een variantie van 0.0289cm².

(a) Aangenomen dat 10% printers die de langste lijnen printen niet worden verkocht, wat is de maximale lengte van een lijn bij een printer die kan verkocht worden?

(b) Bij het lukraak kiezen van 9 printers uit de hele productie, wat is de kans dat er 3 of meer printers een lijn afdrukken met een lengte kleiner dan 24.65cm?

(c) Bij het lukraak kiezen van 9 printers uit de hele productie, wat is de kans dat de gemiddelde lijnlengte zich tussen 24.92 en 25.15cm bevindt?

Vraag 2
Een winkel heeft een heel aanbod MP3's. Een hippe opa vraagt zich af of ze ook MP3's hebben met een opslagcapaciteit van 120GB hebben. De winkelier vindt er geen, maar is wel bereid een schatting te doen van de kostprijs. Hiervoor doet hij een onderzoek op 5 MP3-spelers, met een opslagcapaciteit van respectievelijk 0.5, 1, 2, 8, 16GB en een kostprijs van respectievelijk 12, 14, 17, 171, 228€ (de kostprijzen zijn een benadering van de opgave).

(a) Bereken Pearsons correlatiecoëfficiënt.

  1. Wat toont deze correlatiecoëfficiënt aan?
  2. Wat kan je aan de hand van de uitkomst zeggen over deze correlatie?

(b) Bereken, indien nodig, de regressierechte.

(c) Bereken (schat) de prijs van een MP3-speler met een opslagcapaciteit van 120GB.

  1. Geef 1 reden waarom deze schatting betrouwbaar is, en de werkelijke prijs dicht zal benaderen.
  2. Geef 1 reden waarom deze schatting niet betrouwbaar kan zijn, en het resultaat dus sterk zal verschillen van de werkelijke prijs.

Januari 2012

Reeks 5,  Roels

  1. Vraag 1
    1. Printerfabrikant HeerlijkPrinten (HP) produceert inktpatronen waarmee gemiddeld 3250 papieren kunnenbedrukt worden. Op de doos van het inktpatroon staat vermeld dat 80% van de inktpatronen minstens 3000 kunnen beschrijven. Waaraan is de variantie gelijk indien deze stelling klopt?
    2. Het formularium (8 blzs) zit niet bij de cursustekst en de lector besluit het dan maar zelf af te printen, dit voor alle 150 cursussen. Hij heeft nog een oude inkjetprinter en hij weet dat hij met 1 inktpatroon gemiddeld 1050 bladzijden afdrukt met een variantie van 120 bladzijden. Stel dat je lukraak 8 inktpatronen kiest hoe groot is dan de kans dat je met minstens 3 inktpatronen niet zou kunnen toekomen?
  2. Gegeven een tabel met webpagina's in kB en bezoektijd in seconden. Bereken de correlatiecoëfficiënt van Pearson.
    1. Wat duidt deze correlatiecoëfficiënt aan?
    2. Wat kunnen we besluiten uit de waarde van de coëfficiënt?
    3. Teken indien zinvol de regressierechte.
    4. Maak een schatting van de bezoektijd voor een bestand van xxxx kB groot.
    5. Geef minstens één goede reden waarom dit een accurate schatting zou kunnen zijn.
    6. Geef minstens één goede reden waarom dit geen accurate schatting zou kunnen zijn.

Januari 2011

Reeks 3A-B 21/01/11 13u00, Bertels)

  1. Vraag 1: 900 Linux en 50 windows PCs, van linux zijn er 0.1% defect en van windows 4%.
    1. Wat is de kans dat je achter een werkende linux pc zit?
    2. Wat is de kans dat je achter een werkende windows pc zit?
  2. Vraag 2: Gemiddelde temperaturen voor cpu's:

AMD Athlon 90C - 95C AMD Athlon64 65C - 70C AMD Athlon64 Mobile 95C - 100C AMD Athlon MP 90C - 95C AMD Athlon XP 85C - 90C

gevraagd: Valt de steekproef binnen de gemiddelde temperaturen die hierboven vermeld staan? Bereken dit met een betrouwbaarheidsinterval van 95% en 99%. De standaardafwijking van de sensor is 2 graden celcius.

14 elementen in de steekproef:

AMD Athlon 10 waarden AMD Athlon64 1 waarde AMD Athlon64 Mobile 1 waarde AMD Athlon MP 1 waarde AMD Athlon XP 1 waarde

Tip: Het heeft geen nut om cpu's met slechts 1 waarde te bekijken. Groepeer alles tesamen.


Januari 2010

Reeks 1A (12/01/10 08u30, Roels)

  1. Vraag 1 (Schriftelijk)
    1. Een website administrator wilt zijn site een beetje leven inpompen, en besluit om een spelletje toe te voegen aan zijn site. Hij schrijft een computerprogramma dat per reeks 10 keer een waarde gooit. De kans op een 1 is 15%, de kans op een 2 is 53% en de kans op een 3 is 32%. Bij de 2e reeks, wordt het lot overgelaten aan 3 dobbelstenen. Wanneer de som van de dobbelstenen kleiner of gelijk is aan 4, dan komt er de waarde 2 in de reeks, anders de waarde 3. Wanneer 3 maal voor rij 1 en rij 2 dezelfde waarde voorkomt, win je het spelletje, anders, verlies je.
      Winnend voorbeeld:
#
1
2
3
4
5
6
7
8
9
10
Reeks 1
2
2
1
3
2
3
1
3
2
1
Reeks 2
2
3
2
3
3
2
3
3
3
2
      1. Bereken de kans dat op een plaats in de tabel, bijvoorbeeld de 7e, zowel de eerste als de tweede reeks hetzelfde getal heeft.
      2. Wat is de kans om dit spelletje te winnen?
  1. Vraag 2 (schriftelijk)
    1. Printerfabrikant HashPee maakt printers. Volgens een onderzoek is er een afwijking in de lengte van de printlijn. Deze zou 25cm moeten zijn, maar blijkbaar is daar een lichte afwijking. De variantie is 0,0297 cm². Het gemiddelde muX is onbekend. Na 5 testprintjes zijn de resultaten (5 getallen rond de 25, bv:) 24,96 & 25,71 & 24,33 & 24,67 & 25,48
      1. Bereken het 99% betrouwbaarheidsinterval met het ongekende populatiegemiddelde. Tussenstappen zijn gevraagd, dus niet enkel excel functie en uitkomst.
      2. De CEO van HashPee beweert dat meer dan de helft van de geprinte papieren boven de grens van 24,5cm liggen, is dit waar? Verklaar je antwoord kort.
      3. Hoeveel testen moet men doen om voor een betrouwbaarheidsinterval van 99% met een maximale breedte van 0,25cm over te blijven.

Reeks 1B (12/01/10 13u, Roels)

  1. Vraag 1 (Schriftelijk)
    1. Een fabrikant van inktpatronen. Het aantal bladzijden dat je met één patroon kan afdrukken is normaal verdeeld met het gemiddelde gelijk aan 3500.
      De kans dat je meer dan 3250 bladzijden kan afdrukken bedraagt 80%. Bereken de variantie.
    2. In de cursus statistiek ontbreekt het formularium van 8 blz. Het aantal pagina's die een inktpatroon kan afdrukken is normaalverdeeld met een gemiddelde van ? en een standaarddeviatie van ? (Sorry, ik weet de getalletjes niet meer). De docent wil dit zelf afdrukken, dit zijn 140 exemplaren. Hij wil dit doen met maximaal 1 inktpatroon. Stel dat je 8 inktpatronen nakijkt, wat is de kans dat minstens 3 falen om alles af te drukken?
  2. Vraag 2 (Mondeling): Gegeven is een tabelletje van 5 metingen. Het gaat over bestandscompressie, het aantal kB voor en na compressie.
    1. Bereken de correlatiecoëfficiënt.
      1. Wat kan je hiermee aantonen?
      2. Verklaar of er een zinvol verband is. Wees volledig.
    2. Als er een zinvol bestand is, bereken de regressierechte.
    3. Doe aan de hand van de regressierechte een voorspelling voor een bestand met begingrootte van 540kB.
      1. Geef minstens 1 reden waarom dit een zinvolle voorspelling is.
      2. Geef minstens 1 reden waarom dit geen zinvolle voorspelling is.
    4. Leg uit hoe je met de relatiecoëfficiënt kunt aantonen of er een exponentieel verband is.
    5. Bijvragen
      1. Welke waarden kan de relatiecoëfficiënt aannemen? Welke waarden geven aan dat er een correlatie is?
      2. Wat als de relatiecoëfficiënt 0 is of in de buurt van 0 ligt?

Reeks 5A (Januari 2010 - Bertels)

  1. Een dag voor het examen statistiek begeeft de voeding van je computer het (en die van een klasgenoot). Geen nood want jij gooit nooit iets weg en hebt dus nog 6 voedingen in de kast liggen. Van die 6 zijn er 2 defect.
    1. Wat is de kans dat je lukraak 2 niet defecte voedingen uit neemt?
    2. Wat is de kans dat als je lukraak 2 voedingen neemt waarvan 1 defect is?
  2. Je krijgt een Excel document met daarin verschillende CPU's (met hun aantal MHz) en een benchmark resultaat:
    1. Is er een verband tussen de benchmark en het aantal MHz? Leg dit verband uit
    2. Welke waardes heb je gekozen voor X en welke voor Y en waarom (hoe kom je daarbij)?
    3. Zijn er manieren om deze steekproef te verbeteren?
    4. Dan nog iets met een formule maar dat ben ik vergeten.

Het modelinge examen is een korte bespreking van het hele examen. Bertels zal aanduiden wat er nog mankeert waardoor je dit nog kan aanvullen. Echt diep op in gaan die hij niet (althans toch niet bij mij). Het enige extra dat ik moest uitleggen was wat het resultaat van de correlatie juist betekende (hoe je dit dus moest interpreteren).