Universiteit Utrecht Faculteit Farmacie


Farmaceutische Analyse

laatst bijgewerkt op: 27-06-01
Vraag 1

  1. Zet de meetwaarden in kolommen, klik de op knop "wizard grafieken" (de engelse versie zal een andere naam hebben), kies als grafiektype: "spreiding", subtype: alleen de meetpunten, geen lijnen. Meestal kiest excel de goede meetpunten om de grafiek mee te maken, maar anders kan dat zelf opgegeven worden door te klikken op "reeks" (bovenaan), klik nu op x-waarden en selecteer met de muis de kolom waarin de concentraties staan, klik vervolgens op y-waarden en selecteer de oppervlakten. Klik vervolgens op voltooien.

    Klik vervolgens met je rechter muisknop op een van de meetpunten en kies "trendlijn toevoegen". Kies onder type: lineair en vink aan onder opties: vergelijking in grafiek weergeven en R-kwadraat in grafiek weergeven.


    Apparaat 1: y = 0.8517x + 0.3182
    Apparaat 2: y = 0.999x + 0.0158
  2. Apparaat 1: R2 = 0.9998
    Apparaat 2: R2= 0.9998
  3. aangezien beide apparaten dezelfde regressiecoëfficient hebben, en deze bovendien zeer goed is, is de verleiding groot om te zeggen dat allebei de apparaten lineair zijn tot in ieder geval 19 ppm. Dit is echter ONJUIST!!!

    De regressiecoëfficient geeft aan hoe goed de punten op de rechte lijn vallen. Voor beide apparaten vallen de gemeten punten zeer goed op de lijn, de fouten zijn dus zeer klein. De regressiecoëfficient geeft echter geen informatie over hoe de fouten verdeeld zijn. Hierdoor is het mogelijk dat bij 1 of beide meetreeksen de beste lijn niet een lineaire is, maar dat een kromme lijn beter door de punten loopt. Oftewel dat het verband niet lineair, is maar dat een krom verband geldt.


  4. Bereken met behulp van de formule van de beste rechte lijn zoals beschreven staat bij a het verschil van de meetpunten ten opzichte van de lijn. Vul hiervoor de concentraties in de formule in, dit levert de verwachte waardes. Trek de verwachte waardes af van de gemeten waardes, dit levert de residuen. Zet vervolgens de residuen uit tegen de concentraties.

  1. Apparaat 1:
    Aan de residuen valt te zien dat apparaat 1 een niet lineair verband vertoont, de residuen vertonen namelijk een verband, er valt duidelijk een kromming in de residuen als functie van de concentratie waar te nemen. Als gekeken wordt wanneer dit verband niet meer aanwezig is door steeds aan de bovenkant punten weg te laten (er wordt aangenomen dat de hogere concentraties afwijking van lineair verband vertonen, dit is bij AES een legitieme aanname), en daarna opnieuw de beste rechte lijn te berekenen, blijkt dat er geen enkel gebied is waar de residuen een random verdeling vertonen, het kromme verband blijft telkens aanwezig. Dit betekent dus dat apparaat 1 voor geen enkel concentratiegebied een lineair verband vertoont.

    De beste lijn door de punten blijkt dan ook y=x0,95 te zijn.

    Apparaat 2:
    Aan de residuen valt te zien dat deze random om de 0-lijn verdeeld zijn, dit betekent dat er inderdaad sprake is van een lineair verband tot in ieder geval 19 ppm.

  2. Verder valt ook nog te zien dat de belangrijkste fouten tijdens deze metingen proportioneel blijken te zijn. De residuen worden namelijk groter naarmate de concentratie groter wordt. Als de fout constant geweest was zouden de residuen ook gemiddeld genomen constant blijven.

  3. Apparaat 1:
    De afwijking van de lineariteit is klein, voor de meeste gehaltebepalingen met behulp van de ijklijn-methode is dit apparaat nog steeds goed te gebruiken.

    Voor de Standaard-additie methode wordt de fout door extrapolatie echter snel groter, aanvullend onderzoek zou nodig zijn om deze fout te bepalen.

    Aan de hand van deze uitkomsten kan je wel een redelijke schatting maken wat deze fout zal zijn. Als namelijk alleen de punten vanaf 8 genomen wordt om de lijn mee te trekken (dus alsof er in het monster 7 ppm zit en er 11 standaard-addities van 1 ppm worden toegevoegd, de lijn die dan gevonden wordt: y = 0,8345x + 0,5629), en vervolgens berekend wordt wat het snijpunt met de x-as is blijkt dit -0,674536 te zijn. Aangezien gerekend is alsof in het monster 7 ppm aanwezig is betekent dit een fout van: 0,674536/7*100%= 9,64%. Dus deze lijn, die op het oog zeer goed lineair en precies lijkt te zijn, is niet bruibaar voor een gehaltebepaling via de standaard-additiemethode.

    Apparaat 2:
    Dit apparaat is lineair tot in ieder geval 19 ppm, bovendien zit er zeer weinig spreiding in de meetpunten. Dit apparaat is dus geschikt om een gehaltebepaling mee uit te voeren, zowel via de ijklijnmethode als de standaard-additiemethode.

  4. Voor degenen die bij 1c al uitspraken hebben gedaan over de lineariteit van de metingen zal nu duidelijk moeten zijn waarom aan de hand van de R2 geen uitspraak gedaan kan worden over de lineariteit, maar dat residu-analyse hiervoor veel geschikter is.


Vraag 2

  1. Bij lineareitsonderzoek over meerdere decaden moet altijd met de laagste concentraties begonnen worden, als de hoogste het eerst worden gemeten heb je zeer grote kans om het systeem te verontreinigen waardoor de lagere concentraties niet goed te meten zijn.


  2. Zet de meetwaarden in kolommen, klik de op knop "wizard grafieken" (de engelse versie zal een andere naam hebben), kies als grafiektype: "spreiding", subtype: alleen de meetpunten, geen lijnen. Meestal kiest excel de goede meetpunten om de grafiek mee te maken, maar anders kan dat zelf opgegeven worden door te klikken op "reeks" (bovenaan), klik nu op x-waarden en selecteer met de muis de kolom waarin de concentraties staan, klik vervolgens op y-waarden en selecteer de oppervlakten. Klik vervolgens op voltooien.

    Klik vervolgens met je rechter muisknop op een van de meetpunten en kies "trendlijn toevoegen". Kies onder type: lineair en vink aan onder opties: vergelijking in grafiek weergeven en R-kwadraat in grafiek weergeven.


  3. Op het oog ziet het eruit alsof er een krom verband is, de meetpunten volgen de lijn niet goed. Bedenk echter wel dat eigenlijk alleen de hoogste 4 meetpunten goed te zien zijn, de rest valt over elkaar vlak bij het nulpunt en zijn niet te beoordelen.


  4. Om ook de lagere concentraties beter te beoordelen wordt een log/log-plot gemaakt. bereken met behulp van de log-functie de logaritmische waardes uit en zet deze op dezelfde manier als bij b uit in een grafiek.


     


  5. Trek een lijn zoals beschreven staat bij b, neem de functie over en vul de gemeten concentraties in de formule in, hieruit volgen de verwachtte oppervlaktes. Trek de verwachtte oppervlaktes af van de gemeten oppervlaktes, dit levert de residuen. Zet vervolgens de residuen uit tegen de concentraties.

  6. Uit de residuen valt te zien dat vanaf 0,005 tot 0,05 op een lijn liggen en vanaf 0,05 mg/ml t/m 5mg/ml op een lijn liggen. Het eerste stuk loopt ongeveer horizontaal in het log/log-plot dat zou wijzen op een constante fout van ong. 103 (= 1000), dit gebied is dus verder niet bruikbaar in de analyse.


  7. tweede gedeelte levert een beste rechte lijn op van:

    Let op! Een rechte lijn in een log/log-plot betekent niet automatisch een rechte lijn in een normaal assenstelsel. De richtingscoefficient in het log/log-plot is de macht van de lijn. Een rechte lijn met RC=2 in het log/log-plot levert een kwadratische (y=~x2) functie in een normaal assenstelsel.

    Aangezien in een log/log-plot de RC (0,9749) van de lijn de macht van de lijn in een lineair assenstelsel is, betekent dit dat de regressielijn vrijwel een perfect lineair verband zal vertonen (als de macht van een functie exact 1,0000 is er sprake van een perfect rechte lijn)



  8. Als nu alleen de punten van het interval 0,05 t/m 5 genomen worden om de regressielijn mee te bereken levert dit de volgende lijn op:

    Uit de R-kwadraat = 1 volgt dus ook dat er zeer weinig (absolute)spreiding aanwezig is.



  9. De residuen vertonen geen trend, dus de metingen lijken lineair binnen dit gebied. (let op, op de x-as staat niet de concentratie, maar gewoon het nummer van de meting, zo wordt alles gelijkmatig verdeeld over de as en worden de lagere concentraties niet zo op elkaar gedrukt waardoor de residuen moeilijker te beoordelen zouden zijn).


  10. 0,05 t/m 5 mg/ml MOB: dit gebied vertoont een lineair verband, bovendien is er zeer weinig spreiding, dus het lijkt of er zeer nauwkeurig gemeten kan worden. Voor verdere uitspraken over de precisie zal eerst nog aanvullend onderzoek gedaan moeten worden.

  11. Bij deze hoge concentraties zijn detectoren vaak niet meer lineair, soms kappen ze de bovenkant van een piek ook volledig af waardoor een deel van het opervlakte wegvalt Hierdoor wordt een te laag oppervlakte gevonden. Dit is dus geen fout van de analist, maar de beperking van de apparatuur, bij deze concentraties kan dus niet meer gemeten worden.

  12. Er lijkt een constante fout in de meetwaardes te zitten, waar deze vandaan komt is niet geheel duidelijk. Het meest waarschijnlijk is dat de analist na het inspuiten van de 1mg/ml oplossing toch niet voldoende gespoeld heeft en dat een kleine rest overbleef in de injectiespuit of injector. Omdat de 1mg/ml oplossing 200x sterker is dan de laagste meetoplossing, zal zelfs na goed spoelen de fout niet te verwaarlozen zijn.

    Als er gekozen wordt om inderdaad een hogere standaard eerst in te spuiten om de plaats van de piek te bepalen, moet altijd van te voren een blanco opgenomen worden om te bewijzen dat er niets in het apparaat zit dat stoort, vervolgens moet na de meting ook weer een blanco opgenomen worden om te bewijzen dat niets van de voorgaande injectie is overgebleven. Dit kan echter zoveel problemen opleveren dat er ook in overweging genomen kan worden om gewoon te gaan injecteren zonder eerst de plaats van de piek te bepalen. Bij de hogere concentraties komt deze vanzelf naar voren.

Laatste opmerking: Voor degene die er niet in geslaagd is om de grafieken in excel te maken, is deze excel-file bij vraag 2 aanwezig om down te loaden. Hierin zijn alle grafieken opgenomen, zodat gezien kan worden hoe deze gemaakt zijn. Probeer echter eerst zonder deze file zelf de grafieken te maken!


Vraag 3

  1. aantal OW-recepten = 0,120 * aantal recepten + 0,536

  2. Dag

    voorspelde y

    residuen

    Dag

    voorspelde y

    residuen

    1

    36,7

    -2,7

    7

    36,7

    0,3

    2

    28,2

    1,8

    8

    43,8

    2,2

    3

    51,1

    -0,1

    9

    47,6

    0,4

    4

    31,0

    -1,0

    10

    37,1

    0,9

    5

    34,0

    -1,0

    11

    49,0

    -1,0

    6

    37,7

    0,3

     

     

     

  3. syx = 1,47 (denk er aan dat de afwijking op n-2 vrijheidsgraden wordt berekend !)
    S(xi-xgem)2 = 38900 SE = 0,00746

    De standaard fout in de helling is dus 0,00746. De 95% betrouwbaarheidsinterval is:
    b � t(n-2); 0,025 * SE = 0,120 � 2,26 * 0,00746 = 0,120 � 0,017

  4. 37,11 = 37 OW-recepten

  5. m 340 = a+bX � t(n-2); 0,025 * syx * Ö (1/n + ((340 � xgem)2 / S(x2)))
    m 340 = 0,536 + 0,120 * 340 � 2,26 * 1,47 * Ö (0,091 + (340-322,7)2 / 38900)
    m 340 = 41,336 � 1,044, dus 40, 41 of 42 bezorgrecepten
  6. m 12 = 1,976 � 5,33, dus tussen de 0 en de 7 bezorgrecepten


    Groter, wat ook werd verwacht. De waarde 12 ligt veel verder van het gemiddelde dan 340, dus de laatste term uit de vergelijking is vele malen groter. Anders gezegd: op grote afstand van het zwaartepunt van de lijn is de foutenmarge groter, omdat de fout in de helling een steeds groter effect heeft.

  7. De x0 = 0; de vergelijking is verder analoog aan e.

Vraag 4

  1. het aantal meldingen per recept zal moeten afnemen. De helling zal minder groot zijn.

  2. aantal OW-recepten = - 14,5 + 0,113 * aantal recepten. r = 0,980

  3. Er zijn meerdere toetsen die kunnen worden uitgevoerd. Het meest eenvoudig is de aanname dat bij het ontbreken van een verband de (werkelijke) helling nul is. (Vergelijk dit met figuur 5.2 in Miller & Miller. Statistics for analytical chemistry, 3e editie.)

    H0: b = 0; H1 : b 0
    b wordt geschat met b:
    tberekend = (b - 0) / SE = 0,113 / 0,0104 = 10,9
    t5; 0,025 = 2,57
    tberekend >> ttabel dus H0 mag worden verworpen. Met een foutkans van 5% kan worden gezegd dat er een verband bestaat tussen het aantal recepten en het aantal OW-recepten. Dit wil echter nog niet zeggen dat dit een lineair verband is. Om dit te bekijken kan het beste de afwijkingen van de meetwaarden ten opzichte van de regressielijn (de residuen) bekeken worden. Bij een lineair verband moeten deze residu-waarden normaal om de regressielijn verdeeld liggen. Als er echter een trend te zien is in de residu-waarden wijst dit op een niet lineair verband.

  4. zie vergelijking bij opgave 1e

    y = a+ b*x � t5; 0,025 * syx * Ö (1/7 + (440 � 341,3)2/ 11179,43)
    y = 35,12 � 2,8

    Er wordt aangenomen dat de curve ook bij deze (geëxtrapoleerde) waarde hetzelfde verband vertoond.

  5. zie vergelijking opgave 2e

    y = a+ b*x � t5; 0,025 * syx * S (1/7 + (440 � 341,3)211179,43 + 1)
    y = 35,12 � 4,0

  6. de interval bij een individuele voorspelling (opgave 2e) is veel groter dan het interval van de gemiddelde waarde. Dat is ook verwacht: stel dat er maar 1 waarneming is gedaan dan weet men niet of dat een extreme waarde is. Om de werkelijke waarde (die men niet weet) toch in het de interval te laten vallen, moet dat interval erg groot zijn. Zijn er meerdere waarnemingen dan zullen de extreme waarden elkaar uitmiddelen. Het gemiddelde van deze waarnemingen is een veel betere schatting van de werkelijke waarde en de interval kan kleiner worden bij dezelfde betrouwbaarheid. (NB: er wordt er vanuit gegaan dat er wel dat de waarnemingen normaal verdeeld zijn)

  7. De factor 1/n onder de wortel wordt zeer klein en valt dus weg, de som van de afwijkingen van xgem wordt zo groot dat ook deze factor verdwijnt. De interval wordt dan:
    y = a+ b*x � t5; 0,025 * syx

Vraag 5

  1. juistheid, precisie en lineariteit

  2. werkelijke T = 0,995 * gemeten temperatuur + 0,586

  3. helling: bij elke graad temperatuursverhoging geeft de gerepareerde thermometer een temperatuursverhoging van 0,995 graden Celsius aan.

  4. Een berekening is hier eigenlijk niet nodig; op het oog kan al worden gezien dat de R.C. van de helling sterk afwijkt van 0 en de spreiding in de helling heel klein is. Er is dus een verband. De residu-waarden geven ook niet aan dat er sprake is van een niet-lineair verband, er kan dus aangenomen worden dat er een lineair verband is. Het kan natuurlijk ook met formules maar dat zou veel meer tijd kosten. Tijdens dit practicum is het belangrijker dat een bovenstaand inzicht getoond wordt. De bewijsvoering via formules voert, zeker voor het tentamen, te ver.

  5. De correlatiecoëfficient r (en niet r2) is 0,9999 en geeft informatie over de absolute mate van overeenkomst tussen de gemeten waarden en de regressielijn. Als deze waarde 1 is, betekent dit dat gemeten waarden precies op de berekende lijn liggen. Als de waarde niet exact 1 is maar wel daar heel dicht in de buurt ligt (bijv 0,9999), betekent dit niet automatisch dat er een lineair verband is, het betekent alleen dat het verband heel goed benaderd wordt door een rechte lijn. Het is echter mogelijk dat een kromme het verband nog beter benaderd. Om dit beter te bekijken dienen de residu-waarden bekeken te worden, deze geven niet aan dat er sprake is van een niet-lineair verband.
    De r2 geeft aan welke deel van de totale spreiding (in de y waarde) door regressielijn wordt verklaard. Is r2 = 1 dan is alle spreiding in y te verklaren door de regressielijn. Is de r2 = 0,8 dan is maar 80% van de speiding in de y-waarden te verklaren door dat de x anders is geworden. De overige 20% is onverklaard (toevallige spreiding in het meetresultaat).
    (N.B. voor het bepalen van de correlatie moet zowel de x als de y variabel zijn. Dat is bij deze opgave eigenlijk niet zo, de temperatuur van de gouden standaard is van te voren vastgesteld en dus niet variabel. De R2 en de R kunnen dus eigenlijk niet worden berekend ! We gaan in deze opgave voor het gemak gewoon verder, maar het geeft aan dat er altijd heel goed moet worden beseft wat er eigenlijk worden bepaald. Had er bij opgave 1 en 2 wel de correlatie kunnen worden bepalen ?).

    De precisie van de thermometer is de af te lezen aan het onverklaarde gedeelte in de R2. Ook de syx zegt iets over de spreiding van de punten ten opzichte van de regressielijn, evenals de grafiek van de residuen in y, tegen de x-waarden.

  6. temperatuur

    voorspelde y

    residuen

    temperatuur

    voorspelde y

    residuen

    20,0

    20,5

    -0,091

    100,0

    100,1

    0,089

    50,0

    50,3

    -0,149

    102,0

    102,1

    -0,001

    80,0

    80,2

    0,794

    105,0

    105,1

    0,013

    90,0

    90,2

    0,042

    115,0

    115,0

    -0,339

    95,0

    95,1

    -0,435

    121,0

    121,0

    0,189

    98,0

    98,1

    -0,120

    125,0

    125,0

    0,008

    syx = 0,320

    b = 0,995 � 2,23 * 0,00321 = 0,995 � 0,007

    De werkelijke helling van de lijn ligt met 95% betrouwbaarheid tussen de 0,988 en 1,002.

  7. Als de thermometer juist is, dan zal de helling van de regressielijn 1 zijn.

    H0 : b = 1; H1 : b 1
    tberekend = 0,995 - 1 / SE = 0,005 / 0,00321 = 1,56; t9; 0,025 = 2,23

    Met een foutkans van 5% kan de H0 (dat de thermometer juist is) niet worden verworpen. (er treedt geen proportionele fout op)

    Verder mag het intercept niet afwijken van 0. Dit kan op dezelfde manier bewezen worden als bij vraag 1e, waarbij x0=0. Als nu y=0 binnen het gevonden betrouwbaarheidsinterval ligt, kan met een foutkans van 5% de H0 niet verworpen worden (er treedt ook geen constante fout op).

  8. zie berekening in opgave 2d.

    aangegeven temperatuur = 100,1 � 0,7 graden

    Dit is een strikvraag: voor elke afzonderlijke meting is de voorspellingsinterval natuurlijk even groot. Het gemiddelde van al deze metingen, heeft wel ander interval. Dit is kleiner, omdat de term +1 (uit vergelijking in opgave 2e) dan wegvalt en de vergelijking uit opgave 2d gebruikt kan worden.


Farmaceutische Analyse 5e-jaar | Hoofdpagina Statistiek

2 Februari 2000
Staf Farmaceutische Analyse 5e-jaar