Universiteit Utrecht Faculteit Farmacie


Farmaceutische Analyse

Lineaire Regressie


laatst bijgewerkt op: 27-06-01
Raadpleeg ook de Antwoorden op deze vraagstukken.

Vraag 1

Op een analytisch laboratorium zijn twee AES-apparaten aanwezig. Tijdens de periodieke validatie van de apparatuur is o.a. onderzoek gedaan naar de lineariteit van beide apparaten. Hiertoe zijn analytisch 19 oplossingen van NaCl in 4M HCl gemaakt, hiervan wordt met behulp van beide apparaten de emissie gemeten. De gemeten waardes staan opgenomen in de onderstaande tabel.

Concentratie (ppm)

Emissie Apparaat 1

Emissie Apparaat 2

Concentratie (ppm)

Emissie Apparaat 1

Emissie Apparaat 2

1.00

1.00

0.99

11.00

9.75

10.95

2.00

1.93

2.00

12.00

10.59

11.99

3.00

2.83

3.03

13.00

11.43

13.13

4.00

3.73

3.97

14.00

12.26

13.91

5.00

4.61

5.04

15.00

13.10

15.13

6.00

5.48

6.04

16.00

13.92

16.14

7.00

6.35

7.05

17.00

14.75

16.95

8.00

7.21

7.96

18.00

15.57

17.85

9.00

8.06

9.01

19.00

16.39

18.99

10.00

8.91

9.98

  1. Bepaal (bijv met behulp van Excel) voor beide apparaten de best passende lineaire lijn door de punten.
  2. Bepaal de R2 van beide lijnen.
  3. Wat geeft deze R2 voor informatie over de lineariteit van beide reeksen?
  4. Bepaal de residuen (de verschillen tussen de gemeten waardes en de lineaire lijn) en zet deze uit in een residu-plot.
  5. Wat geven deze residuen voor informatie over de lineariteit van beide reeksen?
  6. Wat valt op aan de residuen van apparaat 2? Welke conclusie valt hieruit te trekken?
  7. Zijn deze apparaten te gebruiken voor een gehaltebepaling via de ijklijn-methode? En voor een gehaltebepaling via de standaard-additie methode?
  8. Vergelijk uw antwoord op 1c met die op 1e. Is het nodig om uw antwoord op 1c bij te stellen?

Tijdens de validatie van analytische apparatuur wordt o.a. het lineaire gebied van het apparaat bepaald. Hiervoor worden metingen over een zeer groot concentratiegebied uitgevoerd. Een probleem hierbij is de grote verschillen in meetwaardes. Normale lineaire regressie gaat ervan uit dat de constante fouten geminimaliseerd worden. Als dit hier wordt uitgevoerd zullen de hoogste meetwaardes (die waarschijnlijk ook de grootste absolute fout hebben) veel te zwaar meetellen, lagere meetwaardes hebben daardoor nauwelijks meer invloed op de regressielijn. De opgave hieronder laat een alternatieve methode van analyseren zien; de log/log-plot.

Een tweede doel van deze vraag is oefenen met het maken van grafieken en uitvoeren van lineaire regressie in excel. Voor degene die weinig ervaring heeft met excel wordt in de uitwerking ook behandeld hoe de grafieken gemaakt kunnen worden.

Vraag 2:

Tijdens de validatie van een HPLC apparaat wordt het lineaire gebied bepaald. De analist die de validatie uitvoert neemt als teststof MOB, hiermee worden metingen gedaan over een zo groot mogelijk concentratiegebied. De analist maakt de oplossingen met analytische nauwkeurigheid en gaat deze oplossingen onderzoeken met behulp van de HPLC. Na eerst een proefmeting gedaan te hebben met de oplossing van 1 mg/ml om de plaats van de piek te bepalen gaat de analist de meetreeks afwerken. Na zeer goed spoelen is de eerste injectie de oplossing met een concentratie van 0,005 mg/ml, de analist werkt vervolgens van lage naar hoge concentratie de monsters af. In de onderstaande tabel zijn de meetresultaten opgenomen.

Concentratie

Oppervlakte

Concentratie

Oppervlakte

0,005

1190,80

0,3

24129,34

0,008

1316,15

0,5

37604,16

0,01

1410,16

1

77793,61

0,03

3000,50

5

376041,60

0,05

4152,13

10

626736,00

0,08

6980,27

20

1214301,00

0,1

7834,20

30

1457161,20

  1. Waarom zal de analist ervoor kiezen om van lage concentratie naar hoog te gaan en niet andersom?
  2. Bereken m.b.v. lineaire regressie de beste rechte lijn door de punten (gebruik hiervoor excel).
  3. Valt er een uitspraak te doen over de lineariteit van het apparaat?
  4. Zet nu de logaritmen van de waarden uit in een log/log-plot.
  5. Laat de computer in het log/log-plot een beste rechte lijn trekken, bereken met behulp van de vergelijking van deze lijn de residue-waarden in dit log/log-plot.
  6. Beoordeel de residuen en kies het interval uit waar de residuen een duidelijk verband vertonen. Laat de computer de beste rechte lijn trekken door de punten in dit interval, wat kan gezegd worden over de lineariteit van de metingen?
  7. Maak van de punten in dit interval ook een normale regressielijn (dus niet van de logaritmische waardes!).
  8. Beoordeel de residuen van deze regressielijn.
  9. Geef de grenzen van het lineaire gebied.
  10. Wat kan een verklaring zijn voor de afwijking van de lineariteit bij hoge concentraties? Had de analist hier wat aan kunnen doen?
  11. Wat kan een verklaring zijn voor de afwijking van de lineariteit bij lage concentraties? Had de analist hier wat aan kunnen doen?

Opgave 3, 4 en 5 zijn bedoeld om het principe van lineaire regressie en de betekenis van de verschillende berekende grootheden beter te leren begrijpen.
De vergelijkingen zijn geen leerstof en er wordt ook niet verwacht dat je met de hand een regressielijn kunt berekenen. Maar inzicht in de achtergrond helpt wel bij het studeren voor de toets.

Vraag 3

Een apotheker denkt dat er een lineair verband bestaat tussen het aantal recepten dat er per dag wordt aangeleverd en het aantal dat recepten dat onder de opiumwet valt. Gedurende een aantal dagen wordt het aantal recepten en opiumwet (OW) recepten bijgehouden.

dag
aantal recepten
OW-recepten
dag
aantal recepten
OW-recepten
a1
301
34
a7
301
37
a2
230
30
a8
360
46
a3
420
51
a9
391
48
a4
253
30
a10
304
38
a5
278
33
a11
403
48
a6
309
38
     

  1. Bepaal de functie van de best passende lijn door de punten. (Als je geen geschikte rekenmachine hebt of over een computer beschikt, neem dan de formule uit de antwoorden over).
  2. Bereken van elke dag hoeveel OW-recepten je op grond van de regressielijn verwacht. Hoeveel wijken deze af van het werkelijk aantal OW-recepten ?
  3. De in b gevonden afwijkingen heten de 'residuen'. Hiermee kan de standaardafwijking in de helling worden bepaald. Bereken deze waarde en geef het 95% betrouwbaarheidsinterval voor de helling.
  4. met sxy is de standaarddeviatie in de residuen en Sxx =S(xi-xgem)2

  5. Hoeveel OW-recepten zullen er gemiddeld binnenkomen als er 304 recepten op een dag worden verwerkt ?
  6. De volgende vergelijking beschrijft de interval van een gemiddelde waarde y bij een gegeven waarde van x.

  7. Reken de interval voor de het gemiddeld aantal OW-recepten uit met een zelf gekozen betrouwbaarheid als de apotheker weet dat er gemiddeld 340 recepten per dag binnenkomen. De syx en de S(x2) zijn al berekend in opgave c.
  8. Als de apotheker tijdens de dienst nu 12 recepten te verwerken krijgt, wordt de interval dan groter of kleiner ? Had je dit ook al kunnen voorspellen (zie vergelijking opgave e) ?
  9. Kun je zelf nu de vergelijking opstellen voor de betrouwbaarheidsinterval van het intercept ?
Vraag 4

De apotheker uit opgave 1 heeft niet zo lang geleden een FTO gehouden over het terugdringen van het opiatengebruik. Om te controleren of dit effect heeft gehad, wordt gedurende een aantal dagen opnieuw het aantal recepten en het aantal OW-recepten geteld.

  1. Als je aanneemt dat het FTO effect heeft gehad, wat verwacht je dan voor de vergelijking van de regressielijn ?
  2. De resultaten waren als volgt:
    dag
    aantal recepten
    OW-recepten
    b1
    304
    20
    b2
    309
    21
    b3
    370
    28
    b4
    290
    17
    b5
    401
    31
    b6
    333
    24
    b7
    382
    27

  3. Bereken de regressielijn.
  4. Wat zou de nulhypothese luiden als je wil toetsen of er een lineair verband bestaat tussen het aantal recepten en het aantal OW-recepten ? Voer de toets uit en bepaal zelf de betrouwbaarheid.
  5. Tip: Teken een grafiek van de regressiepunten als je wel een lineair verband veronderstelt en als je dat niet doet. Bekijk het effect op de helling van de regressielijn.

    Door de bouw van een nieuwbouwwijk is het aantal voorschriften gestegen naar 440 per dag. Wat is gemiddeld aantal OW-recepten dat wordt verwacht en wat is de betrouwbaarheidsinterval ? Van welke veronderstelling ga je uit als je deze waarde berekent met de regressielijn ?

  6. Als er op een dag precies 440 voorschriften worden aangeboden, kan dan de apotheker dan voorspellen hoeveel OW-recepten er zijn ? Wat is het bijbehorende betrouwbaarheidsinterval ?
  7. De vergelijking bij opgave e is:

  8. Wat valt op aan het interval als het antwoord op d en e met elkaar vergelijkt ? Is dat logisch ?
  9. Kan je beredeneren wat het effect is als de interval van e zou worden bepaald op waarneming gedurende 100 dagen in plaats van 7 ? Neem aan dat de regressiecoëfficienten gelijk blijven.
Vraag 5

In een fabriek is een van de thermometers van een sterilisator kapot gegaan. Na reparatie van de thermometer eist de apotheker van de kwaliteitscontrole dat de thermometer wordt gevalideerd.

  1. Op welke parameters zou de thermometer in ieder geval moeten worden gevalideerd ?
  2. Hieronder staan de meetresultaten.

    gouden standaard 
    gerepareerde thermometer 
    gouden standaard 
    gerepareerde thermometer 
    T(in graden C) 
    T(in graden C)
    T(in graden C) 
    T(in graden C) 
    20,0 
    20,4< 
    100,0 
    100,2 
    50,0 
    50,2 
    102,0 
    102,1 
    80,0 
    81,0 
    105,0 
    105,1 
    90,0 
    90,2 
    115,0 
    114,7 
    95,0 
    94,7 
    121,0 
    121,2 
    98,0 
    98,0 
    125,0 
    125,0 
  3. Stel de regressielijn op.
  4. Omschrijf in woorden wat de waarde van de helling betekent.
  5. Controleer of er een (lineair) verband bestaat tussen beide waarden.
  6. Wat zegt de correlatiecoëfficient over de precisie van de thermometer ? Welke andere grootheid die met de lineaire regressie is uit te rekenen, zegt iets over de precisie ?
  7. Bereken net als bij opgave 1c de residuen. Bepaal de standaarddeviatie in de helling en geef het betrouwbaarheidsinterval van de helling. Omschrijf in woorden wat deze betrouwbaarheids-interval nu betekent.
  8. Doe een uitspraak over de juistheid van de gerepareerde thermometer. Wat is de nulhypothese ?
  9. Doe een voorspelling tussen welke grenzen de aangegeven waarde zal liggen als de gerepareerde thermometer in een kokend waterbad wordt gehangen. Zal dit interval veranderen als dezelfde meting honderd maal wordt uitgevoerd ?
[1] (gedeeltelijk) uit: Toegepaste statistiek voor farmaceuten; Farmaceutische laboratoria Rijksuniversiteit Groningen; 1989.
Farmaceutische Analyse 5e-jaar | Hoofdpagina Statistiek

2 Februari 2000
Staf Farmaceutische Analyse 5e-jaar