Der NORDTEST-Ansatz
Das NORDTEST-Handbook for calculation of measurement uncertainty in environmental laboratories beschreibt ein Verfahren, das Daten aus der Routinequalitätssicherung und Validierung für die Abschätzung der Messunsicherheit nutzt. Hier wird also nicht versucht, das Messverfahren in möglichst kleine Schritte aufzuteilen und die Einzelunsicherheiten dann zu quantifizieren. Hier wird vielmehr versucht, alle Beiträge zu einer statistischen Abweichung und alle, die zu einer systematischen Abweichung führen, jeweils integrativ aus den o.g. Daten zu ermitteln. Dieser Ansatz wurde auch DIN ISO 11352 umgesetzt.
Die grundsätzliche Vorgehensweise ist in obigem Diagramm dargestellt.
Die Ermittlung sollte unter den Bedingungen stattfinden, die auch bei der Routineanalytik gelten. Das sind keine Wiederholbedingungen, aber auch keine Vergleichsbedingungen, sondern Zwischenbedingungen. Diese Bedingungen sind z.B. für Regelkarten erfüllt.
Möglichkeit 1: aus Kontrollproben, die die gesamte Analytik abdecken
Wenn die Kontrollprobe den gesamten analytischen Bereich abdeckt (inklusive der Probenvorbereitung) und die Matrices der Kontrollprobe und der Routineproben ähnlich sind, dann kann Rw direkt aus der Analytik der Kontrollproben (Regelkarte) abgeschätzt werden. Bei großen Konzentrationsbereichen sollten mehrere Kontrollproben unterschiedlicher Konzentration verwendet werden.
uRw = sRw
Möglichkeit 2: aus Kontrollproben für abweichende Matrices und/oder Konzentrationen
Wenn eine synthetische Kontrollprobe verwendet wird und die Matrices der Kontrollprobe und der Routineproben nicht ähnlich sind, dann müssen die Unsicherheitsbeiträge, die aus den verschiedenen Matrices resultieren, zusätzlich einbezogen werden Diese können aus der Wiederholbarkeit bei verschiedenen Matrices (Spannweitenregelkarte) abgeschätzt werden.
Möglichkeit 3: aus instabilen Kontrollproben
Wenn es keine stabile Kontrollprobe gibt (z.B. Sauerstoffmessung), dann können zunächst nur Unsicherheitsbeiträge aus der Wiederholbarkeit (Spannweitenregelkarte) abgeschätzt werden. Die Langzeit-Komponenten (von Serie zu Serie) müssen beispielsweise über eine Expertenschätzung aus der Erfahrung hinzugefügt werden.
Diese kann abgeschätzt werden aus:
- der Analytik von zertifizierten Referenzmaterialien
- der Teilnahme an Ringversuchen oder
- aus Wiederfindungsexperimenten.
Quellen für systematische Abweichungen sollten, wenn möglich, immer eliminiert werden. Wenn die systematische Abweichung signifikant ist und auf zuverlässigen Daten (z.B. ZRM) basiert, sollte das Messergebnis entsprechend korrigiert werden. Systematische Abweichungen können von der Matrix abhängen. Dies kann durch die Verwendung von in der Matrix unterschiedlichen Referenzmaterialien geprüft werden.
Die Unsicherheitskomponente besteht aus weiteren Einzelkomponenten:
- die Abweichung selbst (z.B. in % Differenz vom Vorgabewert bzw. zertifizierten Wert) und ggf. die Unsicherheit der Bestimmung dieser Abweichung
- die Unsicherheit des Vorgabewerts bzw. zertifizierten Werts uCref
ubias kann abgeschätzt werden aus der Kombination dieser beiden Komponenten:
bzw. unter Einbeziehung der Unsicherheit der Bestimmung der Abweichung
Möglichkeit 1: Verwendung eines zertifizierten Referenzmaterials
bias - aus dem Mittelwert der Abweichungen der mehrfachen Analytik des Referenzmaterials
sbias - die Standardabweichung der mehrfachen Analytik des Referenzmaterials
nM - die Zahl der Messungen des Referenzmaterials
uCref - die Standardunsicherheit des Referenzmaterials (aus dem Zertifikat entnommen)
Möglichkeit 2: Verwendung mehrerer zertifizierter Referenzmaterialien
Die Analytik mehrerer Referenzmaterialien liefert mittlere Abweichungen für jedes Ref.-Material i. Aus diesen Abweichungen biasi und der Zahl der analysierten Referenzmaterialien sowie der Standardunsicherheit der zertifizierten Wertes lässt sich nach obiger Gleichung wiederum ubias berechnen.
Möglichkeit 3: Verwendung von Ringversuchsergebnissen
Die Unsicherheit des Vorgabewertes von Ringversuchen ergibt sich, falls der Vorgabewert aus dem Mittelwert der Teilnehmer errechnet wurde, zu:
oder falls der Median oder robuste Schätzverfahren zur Berechnung eingesetzt wurden gemäß ISO 13528 zu:
Falls andere Methoden zur Festlegung des Vorgabewertes verwendet wurden, muss die Unsicherheit des Vorgabewertes beim Ringversuchsveranstalter erfragt werden.
Um ein einigermaßen klares Bild der Abweichungen eines Labor zu bekommen, sollte das Labor an mindestens sechs Ringversuchsproben innerhalb eines angemessenen Zeitraums analysiert haben.
Für die Analytik dieser Ringversuchsproben werden die jeweiligen Abweichungen biasi vom Vorgabewert ermittelt. Die Unsicherheiten der Vorgabewerten werden zur weiteren Berechnung gemittelt.
ubias ergibt sich dann zu:
wobei nR für die Zahl der verwendeten Ringversuchsproben steht.
Möglichkeit 4: Verwendung von Ergebnissen von Wiederfindungsversuchen
Wiederfindungsexperimente werden häufig bei der Validierung oder Verifizierung von Analysenverfahren durchgeführt. Dabei wird eine Probe mit dem Analyten aufgestockt und sowohl vor als auch nach der Aufstockung gemessen. Aus der Differenz der Messungen und der zugegebenen Menge an Analyt kann dann die Wiederfindung berechnet werde. Falls keine systematische Abweichung auftritt, sollte der Mittelwert mehrerer Aufstockungsversuche bei 100 % liegen.
Selbstverständlich ist auch hier die Menge an zugegebenem Analyten mit einer Unsicherheit behaftet.
Als Beispiel sei hier die Aufstockung einer realen Probe mit einer Standardlösung (mit Herstellerzertifikat) mittels einer Mikropipette dargestellt. Die Unsicherheit der Konzentration der Standardlösung ergibt sich direkt aus dem Zertifikat des Herstellers. Dort finden wir die Angabe ± 1,2 % (Vertrauensniveau 95%). Zur Umrechnung auf eine Standardunsicherheit müssen wir diesen Wert durch 1,96 dividieren und erhalten näherungsweise:
uconc = 0,6 %
Für die Abschätzung der Unsicherheit des zugegebenen Volumens werden Angaben des Herstellers der Mikropipette verwendet. Dieser gibt als systematischen Fehler eine max. Abweichung von 1% an und als Wiederholbarkeit (zufälligen Fehler) eine Standardabweichung von max. 0,5 %. Die Angabe für die Wiederholbarkeit kann direkt verwendet werden, die max. Abweichung muss noch in eine Standardabweichung umgerechnet werden. Da alle Werte im Bereich ± 1 % als gleich wahrscheinlich angenommen werden müssen, wird ein Rechteckverteilung der möglich Werte angenommen. Für eine Rechteckverteilung mit halber Breite a berechnet sich die Standardabweichung zu a/√3. Für die Standardunsicherheit des zugegebenen Volumen ergibt sich damit:
Die Gesamtunsicherheit der Aufstockung ist damit:
Zur Berechnung der gesamten Unsicherheit der Abweichung werden jetzt noch die Abweichungen in den Wiederfindungsversuchen herangezogen. Für Wiederfindungen von z.B. 95%, 98%, 97%, 96%, 99% und 96% ergeben sich dann Abweichungen von 5%, 2%, 3%, 4%, 1% und 4%.
Wie oben berechnet man:
oder im geschilderten Beispiel:
Die Gesamtstandardunsicherheit oder kombinierte Standardunsicherheit uc berechnet sich aus der Kombination der Unsicherheitskomponente durch zufällige Abweichungen uRw mit der Unsicherheitskomponente durch systematische Methoden- und Laborabweichungen ubias.
Dieser Wert gibt die geschätzte Unsicherheit des Messwerts auf dem Vertrauensniveau der Standardabweichung (ca. 68%) an. Zur Umrechnung auf ein höheres Vertrauensniveau kann dieser Wert mit einem Erweiterungsfaktor k multipliziert werden. Die Wahl von k entscheidet über die Höhe des Vertrauensniveaus.
In der Praxis hat sich meist ein Erweiterungsfaktor k=2 durchgesetzt. Dies entspricht einem Vertrauensniveau von ungefähr 95%.
Wenn die Daten für die gezeigten Berechnungen nicht vorliegen und wenn die Anforderungen an die Messunsicherheit nur relativ gering sind, dann kann eine grobe Schätzung der Messunsicherheit direkt aus der Vergleichsstandardabweichung von Ringversuchen abgeleitet werden. Dann wird
uc = sR
gesetzt. Dabei ist sR die Vergleichsstandardabweichung aus einem Ringversuch.
Damit wird dann:
U = 2 ∙ SR
Diese Schätzung könnte - abhängig von der Qualität des Labors - zu hoch sein ("worst case"). Sie könnte aber wegen größerer Inhomogenitäten der realen Proben im Vergleich zum Ringversuch oder anderer Matrices auch zu niedrig sein.