Aktionen

Differenzen der Berechnungsergebnisse: Unterschied zwischen den Versionen

Aus BAWiki

imported>Lang Guenther
(→‎Quantil Q99: Skill 4 nach Murphy)
imported>Lang Guenther
(→‎Skill 4 nach Murphy: DOI gelöscht da Probleme bei Darstellung und Verlinkung)
Zeile 285: Zeile 285:


Literatur:
Literatur:
# Murphy, Allan H. (1988) "Skill Scores Based on the Mean Square Error and Their Relationship to the Correlation Coefficient". Monthly Weather Review, Dec. 1988, Seiten 2417 - 2424, doi: [http://dx.doi.org/10.1175/1520-0493(1988)116<2417:SSBOTM>2.0.CO;2]
# Murphy, Allan H. (1988) "Skill Scores Based on the Mean Square Error and Their Relationship to the Correlation Coefficient". Monthly Weather Review, Dec. 1988, Seiten 2417 - 2424.  


Die Berechnung wird für Daten der Kategorie '''KC''' und '''KN''' durchgeführt, also für alle Datensätze, die für mehr als einen Termin vorhanden sind. Der Skill S4 nach Murphy (1988, Gleichung 4) kann wie folgt charakterisiert werden:
Die Berechnung wird für Daten der Kategorie '''KC''' und '''KN''' durchgeführt, also für alle Datensätze, die für mehr als einen Termin vorhanden sind. Der Skill S4 nach Murphy (1988, Gleichung 4) kann wie folgt charakterisiert werden:

Version vom 27. August 2018, 08:21 Uhr


Einführung

Für die von

können verschiedene Differenzen berechnet werden. Typischer Weise lassen sich die verschiedenen Eingangsdaten wie folgt kategorisieren:

  • Kategorie K0: [math]\displaystyle{ f(x,y,z) }[/math], von der Zeit unabhängige Größen;
  • Kategorie K1: [math]\displaystyle{ f(x,y,z,t_1) }[/math], von der Zeit abhängige Größen, ein Termin;
  • Kategorie KC: [math]\displaystyle{ f(x,y,z,t_i) }[/math], von der Zeit abhängige Größen, mehrere diskrete Termine, äquidistanter Zeitschritt [math]\displaystyle{ \Delta_t }[/math];
  • Kategorie KN: [math]\displaystyle{ f(x,y,z,t_i) }[/math], von der Zeit abhängige Größen, mehrere diskrete Termine, nicht äquidistanter Zeitschritt [math]\displaystyle{ \Delta_t(i) }[/math].

Für geophysikalische Daten spielen insbesondere die Kategorien K1, KC und KN eine Rolle. Beispiele:

  • Kategorie K1: Topografie/Bathymetrie [math]\displaystyle{ h(x,y,z,t_1) }[/math] für einen bestimmten Termin;
  • Kategorie KC: Wasserspiegelauslenkung [math]\displaystyle{ \eta(x,y,z,t_i) }[/math] zu äquidistanten Terminen [math]\displaystyle{ t_i }[/math], z. B. von einem mathematischen Verfahren berechnet;
  • Kategorie KN: Tidehochwasser [math]\displaystyle{ \eta^{\rm{Thw}}(x,y,z,t_i) }[/math] zu nicht äquidistanten Terminen [math]\displaystyle{ t_i }[/math], z. B. als Analyse-Ergebnis einer Wasserstandszeitreihe.

Definitionen

  • Referenz-Daten [math]\displaystyle{ r }[/math]: Gegenüber [math]\displaystyle{ r }[/math] werden verschiedene Abweichungen von [math]\displaystyle{ f }[/math] ermittelt. Können Beobachtungsdaten, Simulations- oder Analyse-Ergebnisse für einen ausgezeichneten Zustand sein;
  • Vergleichs-Daten [math]\displaystyle{ f }[/math]: Können ebenfalls Beobachtungsdaten, Simulations- oder Analyse-Ergebnisse sein, deren Unterschiede zu den Referenz-Daten ermittelt werden sollen. Z. B. Ergebnisse für einen anderen Zeitraum (natürliche Variation) oder (anthropogen beeinflussten Ausbau-) Zustand eines Systems;
  • Logical-Operator 1: [math]\displaystyle{ V(r_i) }[/math] liefert den Ergebniswert .T. oder .F., in Abhängigkeit ob [math]\displaystyle{ r_i }[/math] gültig oder ungültig ist. Auf [math]\displaystyle{ f_i }[/math] angewendet gilt dasselbe.
  • Logical-Operator 2: [math]\displaystyle{ V(r_I,f_i) }[/math] liefert den Ergebniswert .T. oder .F., in Abhängigkeit ob [math]\displaystyle{ V(r_i)\land V(f_i) }[/math] gültig oder ungültig ist.
  • Integer-Operator 1: [math]\displaystyle{ P(r_i) }[/math] liefert den Ergebniswert 1 falls [math]\displaystyle{ V(r_i) }[/math] .T. ist und ansonsten den Wert 0. Auf [math]\displaystyle{ f_i }[/math] angewendet gilt dasselbe.
  • Integer-Operator 2: [math]\displaystyle{ P(r_i,f_i) }[/math] liefert den Ergebniswert 1 falls [math]\displaystyle{ V(r_i)\land V(f_i) }[/math] .T. ist und ansonsten den Wert 0.

Voraussetzungen für die Berechnung von Differenzen

Folgende Voraussetzungen müssen die Eingangsdaten [math]\displaystyle{ r }[/math] und [math]\displaystyle{ f }[/math] erfüllt werden:

  1. [math]\displaystyle{ r }[/math] und [math]\displaystyle{ f }[/math] müssen derselben Kategorie (siehe oben) angehören;
  2. die Anzahl der Termine [math]\displaystyle{ t_i }[/math] muss für [math]\displaystyle{ r }[/math] und [math]\displaystyle{ f }[/math] identisch sein;
  3. für Daten der Kategorie KC müssen die äquidistanten Zeitschritte [math]\displaystyle{ \Delta t }[/math] für [math]\displaystyle{ r }[/math] und [math]\displaystyle{ f }[/math] übereinstimmen;
  4. (physikalische) Dimension und Bedeutung müssen für [math]\displaystyle{ r }[/math] und [math]\displaystyle{ f }[/math] äquivalent sein;
  5. sowohl [math]\displaystyle{ r_i }[/math] (kurz für [math]\displaystyle{ r(x,y,z,t_i) }[/math]) als auch [math]\displaystyle{ f_i }[/math] (kurz für [math]\displaystyle{ r(x,y,z,t_i) }[/math]) müssen für den Termin [math]\displaystyle{ i }[/math] gültig sein; ansonsten wird ein ungültiger Wert berechnet.

Berechnungsergebnisse

Doe nachfolgenden Größen können mit dem Programm NCDELTA berechnet werden.

Gewöhnliche Differenzen

Differenz

Das Ergebnis wird für alle Termine (ein Ergebniswert bei zeitunabhängigen Daten) für alle Positionen [math]\displaystyle{ (x,y,z) }[/math] berechnet:

  1. Es wird die Differenz zwischen [math]\displaystyle{ f_i }[/math] und [math]\displaystyle{ r_i }[/math] berechnet, falls [math]\displaystyle{ V(r_i,f_i) }[/math] den Wert .T. liefert:
    [math]\displaystyle{ d_i = f_i - r_i }[/math], falls [math]\displaystyle{ V(r_i,f_i) }[/math];
  2. Das Ergebnis wird mit invalid gekennzeichnet, falls [math]\displaystyle{ V(r_i,f_i) }[/math] den Wert .F. ergibt:
    [math]\displaystyle{ d_i = \rm{invalid} }[/math], falls [math]\displaystyle{ \lnot V(r_i,f_i) }[/math].

Die Berechnung wird für Daten der Kategorien K0, K1, KC und KN durchgeführt, also für alle Arten von Daten.

Maximale Differenz

Es wird der dem Betrage nach maximale Wert unter Beibehaltung des Vorzeichens ermittelt:

  1. Zunächst werden alle Differenzen [math]\displaystyle{ d_i }[/math] wie oben beschrieben berechnet;
  2. Aus den gültigen Werten wird ein Index [math]\displaystyle{ i^\max }[/math] so ermittelt, dass dort [math]\displaystyle{ \left|d_i\right| }[/math] maximal wird
    [math]\displaystyle{ d^\max = d_{i^\max} }[/math].
    bezeichnet dann die im Sinne dieser Definition maximale Differenz; diese kann positiv, negativ oder Null sein;
  3. Falls alle Werte [math]\displaystyle{ d_i }[/math] ungültig sind, wird [math]\displaystyle{ d^\max = \rm{invalid} }[/math] gesetzt.

Die Berechnung wird für Daten der Kategorien KC und KN durchgeführt, also für alle Datensätze, die für mehr als einen Termin vorhanden sind. Man erhält immer dann einen gültigen Wert für [math]\displaystyle{ d^\max }[/math], falls wenigstens eine gültige Differenz [math]\displaystyle{ d_i }[/math] vorhanden ist. Programme wie NCPLOT ermöglichen bei der Visualisierung eine Filterung der dargestellten Daten mit Hilfe der Anzahl der gültigen Differenzen.

Minimale Differenz

Es wird der dem Betrage nach minimale Wert unter Beibehaltung des Vorzeichens ermittelt:

  1. Zunächst werden alle Differenzen [math]\displaystyle{ d_i }[/math] wie oben beschrieben berechnet;
  2. Aus den gültigen Werten wird ein Index [math]\displaystyle{ i^\min }[/math] so ermittelt, dass dort [math]\displaystyle{ \left|d_i\right| }[/math] minimal wird
    [math]\displaystyle{ d^\min = d_{i^\min} }[/math].
    bezeichnet dann die im Sinne dieser Definition minimale Differenz; diese kann positiv, negativ oder Null sein;
  3. Falls alle Werte [math]\displaystyle{ d_i }[/math] ungültig sind, wird [math]\displaystyle{ d^\min = \rm{invalid} }[/math] gesetzt.

Die Berechnung wird für Daten der Kategorien KC und KN durchgeführt, also für alle Datensätze, die für mehr als einen Termin vorhanden sind. Man erhält immer dann einen gültigen Wert für [math]\displaystyle{ d^\min }[/math], falls wenigstens eine gültige Differenz [math]\displaystyle{ d_i }[/math] vorhanden ist. Programme wie NCPLOT ermöglichen bei der Visualisierung eine Filterung der dargestellten Daten mit Hilfe der Anzahl der gültigen Differenzen.

Mittlere Differenz

Es wird der Mittelwert aller gültigen Differenzen berechnet:

  1. Zunächst werden alle Differenzen [math]\displaystyle{ d_i }[/math] wie oben beschrieben berechnet;
  2. Aus den gültigen Werten folgt für den Mittelwert
    [math]\displaystyle{ d^{\rm{mit}}=\frac{\sum_{i\in I}P(d_i)d_i}{\sum_{i\in I}P(d_i)} }[/math];
  3. Falls alle Werte [math]\displaystyle{ d_i }[/math] ungültig sind, wird [math]\displaystyle{ d^{\rm{mit}} = \rm{invalid} }[/math] gesetzt.

Die Berechnung wird für Daten der Kategorien KC und KN durchgeführt, also für alle Datensätze, die für mehr als einen Termin vorhanden sind. Man erhält immer dann einen gültigen Wert für [math]\displaystyle{ d^{\rm{mit}} }[/math], falls wenigstens eine gültige Differenz [math]\displaystyle{ d_i }[/math] vorhanden ist. D. h. die Mittelwerte können Stichproben unterschiedlicher Größe entstammen. Programme wie NCPLOT ermöglichen bei der Visualisierung eine Filterung der dargestellten Daten mit Hilfe der Anzahl der gültigen Differenzen.

Mittlere Abweichung

Es wird die Abweichung aller gültigen Differenzen berechnet:

  1. Zunächst werden alle Differenzen [math]\displaystyle{ d_i }[/math] wie oben beschrieben berechnet;
  2. Aus den gültigen Werten folgt für die Abweichung
    [math]\displaystyle{ d^{\rm{abw}}=\frac{\sum_{i\in I}P(d_i)\left|d_i\right|}{\sum_{i\in I}P(d_i)} }[/math];
  3. Falls alle Werte [math]\displaystyle{ d_i }[/math] ungültig sind, wird [math]\displaystyle{ d^{\rm{abw}} = \rm{invalid} }[/math] gesetzt.

Die Berechnung wird für Daten der Kategorie KC und KN durchgeführt, also für alle Datensätze mit äquidistantem Zeitschritt. Man erhält immer dann einen gültigen Wert für [math]\displaystyle{ d^{\rm{abw}} }[/math], falls wenigstens eine gültige Differenz [math]\displaystyle{ d_i }[/math] vorhanden ist. D. h. den Abweichungen können Stichproben unterschiedlicher Größe zu Grunde liegen. Programme wie NCPLOT ermöglichen bei der Visualisierung eine Filterung der dargestellten Daten mit Hilfe der Anzahl der gültigen Differenzen.

Root Mean Square Error (RMSE)

Es wird die RMSE aus allen gültigen Differenzen berechnet:

  1. Zunächst werden alle Differenzen [math]\displaystyle{ d_i }[/math] wie oben beschrieben berechnet;
  2. Aus den gültigen Werten ergibt sich die RMSE nach der einschlägig bekannten Formel;
  3. Falls alle Werte [math]\displaystyle{ d_i }[/math] ungültig sind, wird RMSE = invalid gesetzt.

Die Berechnung wird für Daten der Kategorie KC und KN durchgeführt, also für alle Datensätze mit äquidistantem Zeitschritt. Man erhält immer dann einen gültigen Wert für RMSE, falls wenigstens eine gültige Differenz [math]\displaystyle{ d_i }[/math] vorhanden ist. D. h. den RMSE-Werten können Stichproben unterschiedlicher Größe zu Grunde liegen. Programme wie NCPLOT ermöglichen bei der Visualisierung eine Filterung der dargestellten Daten mit Hilfe der Anzahl der gültigen Differenzen.

Anzahl der gültigen Differenzen

Die Anzahl der gültigen Differenzen kann von Ort zu Ort variieren. Daher liegt einigen der oben beschriebenen Größen eine unterschiedlich große Stichprobe für ihre Berechnung zu Grunde:

  1. Zunächst werden alle Differenzen [math]\displaystyle{ d_i }[/math] wie oben beschrieben berechnet;
  2. Die Anzahl der gültigen Differenzen ergibt sich dann zu
    [math]\displaystyle{ N_{\rm{ord}}=\sum_{i\in I}P(d_i) }[/math];

Die Berechnung wird für Daten der Kategorien KC und KN durchgeführt, also für alle Datensätze, die für mehr als einen Termin vorhanden sind. In Programmen wie NCPLOT können z. B. die Maximale Differenz, die Minimale Differenz, der Mittelwert sowie die Mittlere Abweichung mit Hilfe dieser Größe bei der Visualisierung gefiltert werden. So können Darstellungen erzeugt werden, die z. B. das Ergebnis nur für Orte darstellen, an denen alle, oder eine bestimmte Anzahl von Ereignissen für die Berechnung der Daten zur Verfügung standen.

Daten für das Taylor-Diagramm

Taylor Diagramme ermöglichen "a concise statistical summary of how well patterns match each other in terms of their correlation, their root-mean-square difference and the ratio of their variances." Zusätzliche Informationen wie z. B. der absolute oder prozentuale Unterschied bezüglich der Mittelwerte (Bias) können prinzipiell in Taylor Diagrammen ergänzt werden. Ein Taylor Diagramm bietet einen ausgezeichneten grafischen Rahmen, um verschiedene Variable eines oder mehrerer Modelle, einer oder mehrere Simulationsrechnungen mit Referenzdaten vergleichen zu können.

Literatur und weitere Informationen:

  1. Taylor, K. E. (2001), Summarizing multiple aspects of model performance in a single diagram, Journal of Geophysical Research, 106 (D7), 7183–7192, doi: http://dx.doi.org/10.1029/2000JD900719;
  2. http://www-pcmdi.llnl.gov/about/staff/Taylor/CV/Taylor_diagram_primer.htm mit einer kurzen Einführung in das Diagramm durch K. E. Taylor sowie weiteren Hinweisen auf Anwendungsbeispiele.

Standardabweichung der Referenzdaten

Es wird die Standardabweichung für alle gültigen Referenzdaten berechnet:

  1. Zunächst wird der Mittelwert der Referenzdaten [math]\displaystyle{ r }[/math] ermittelt
    [math]\displaystyle{ \bar{r}=\frac{\sum_{i\in I}P(r_i,f_i)r_i}{\sum_{i\in I}P(r_i,f_i)} }[/math];
  2. Falls ein gültiger Mittelwert berechnet werden konnte folgt für die Standardabweichung
    [math]\displaystyle{ \sigma_r = \sqrt{\frac{\sum_{i\in I}P(r_i,f_i)\left(r_i-\bar{r}\right)^2}{\sum_{i\in I}P(r_i,f_i)}} }[/math];
  3. Falls alle Werte [math]\displaystyle{ P(r_i,f_i) }[/math] 0 sind, wird [math]\displaystyle{ \sigma_r = \rm{invalid} }[/math] gesetzt.

Die Berechnung wird für Daten der Kategorien KC und KN durchgeführt, also für alle Datensätze, die für mehr als einen Termin vorhanden sind. Man erhält immer dann einen gültigen Wert für [math]\displaystyle{ \sigma_r }[/math], falls wenigstens ein auf 1 lautender Wert [math]\displaystyle{ P(r_i,f_i) }[/math] vorhanden ist. D. h. die Standardabweichungen können Stichproben unterschiedlicher Größe entstammen. Programme wie NCPLOT ermöglichen bei der Visualisierung eine Filterung der dargestellten Daten mit Hilfe der Anzahl der gültigen Taylor Daten.

Anmerkung: Wir verwenden hier [math]\displaystyle{ P(r_i,f_i) }[/math] und nicht [math]\displaystyle{ P(r_i) }[/math] um sicherzustellen, dass sich die für das Taylor Diagramm benötigten Daten jeweils auf denselben Stichprobenumfang beziehen.

Standardabweichung der Vergleichsdaten

Es wird die Standardabweichung für alle gültigen Vergleichsdaten berechnet:

  1. Zunächst wird der Mittelwert der Vergleichsdaten [math]\displaystyle{ f }[/math] ermittelt
    [math]\displaystyle{ \bar{f}=\frac{\sum_{i\in I}P(r_i,f_i)f_i}{\sum_{i\in I}P(r_i,f_i)} }[/math];
  2. Falls ein gültiger Mittelwert berechnet werden konnte folgt für die Standardabweichung
    [math]\displaystyle{ \sigma_f = \sqrt{\frac{\sum_{i\in I}P(r_i,f_i)\left(f_i-\bar{f}\right)^2}{\sum_{i\in I}P(r_i,f_i)}} }[/math];
  3. Falls alle Werte [math]\displaystyle{ P(r_i,f_i) }[/math] 0 sind, wird [math]\displaystyle{ \sigma_f = \rm{invalid} }[/math] gesetzt.

Die Berechnung wird für Daten der Kategorien KC und KN durchgeführt, also für alle Datensätze, die für mehr als einen Termin vorhanden sind. Man erhält immer dann einen gültigen Wert für [math]\displaystyle{ \sigma_f }[/math], falls wenigstens ein auf 1 lautender Wert [math]\displaystyle{ P(r_i,f_i) }[/math] vorhanden ist. D. h. die Standardabweichungen können Stichproben unterschiedlicher Größe entstammen. Programme wie NCPLOT ermöglichen bei der Visualisierung eine Filterung der dargestellten Daten mit Hilfe der Anzahl der gültigen Taylor Daten.

Anmerkung: Wir verwenden hier [math]\displaystyle{ P(r_i,f_i) }[/math] und nicht [math]\displaystyle{ P(f_i) }[/math] um sicherzustellen, dass sich die für das Taylor Diagramm benötigten Daten jeweils auf denselben Stichprobenumfang beziehen.

Mittelwert der Referenzdaten

Es wird der Mittelwert berechnet, wobei in die Berechnung des Mittelwertes [math]\displaystyle{ \bar{r} }[/math] nur diejenigen Termine einfließen, für die sowohl [math]\displaystyle{ V(r_i) }[/math] als auch [math]\displaystyle{ V(f_i) }[/math] gültig sind:

  1. Aus den gültigen Werten [math]\displaystyle{ V(r_i,f_i) }[/math] folgt für den Mittelwert
    [math]\displaystyle{ \bar{r}=\frac{\sum_{i\in I}P(r_i,f_i)r_i}{\sum_{i\in I}P(r_i,f_i)} }[/math];
  2. Falls alle Werte [math]\displaystyle{ V(r_i,f_i) }[/math] ungültig sind, wird [math]\displaystyle{ \bar{r} = \rm{invalid} }[/math] gesetzt.

Die Berechnung wird für Daten der Kategorien KC und KN durchgeführt, also für alle Datensätze, die für mehr als einen Termin vorhanden sind. Man erhält immer dann einen gültigen Wert für [math]\displaystyle{ \bar{r} }[/math], falls wenigstens ein gültiger Wert [math]\displaystyle{ V(r_i,f_i) }[/math] vorhanden ist. D. h. die Mittelwerte können Stichproben unterschiedlicher Größe entstammen. Programme wie NCPLOT ermöglichen bei der Visualisierung eine Filterung der dargestellten Daten mit Hilfe der Anzahl der gültigen Taylor Daten.

Mittelwert der Vergleichsdaten

Es wird der Mittelwert berechnet, wobei in die Berechnung des Mittelwertes [math]\displaystyle{ \bar{f} }[/math] nur diejenigen Termine einfließen, für die sowohl [math]\displaystyle{ V(r_i) }[/math] als auch [math]\displaystyle{ V(f_i) }[/math] gültig sind:

  1. Aus den gültigen Werten [math]\displaystyle{ V(r_i,f_i) }[/math] folgt für den Mittelwert
    [math]\displaystyle{ \bar{f}=\frac{\sum_{i\in I}P(r_i,f_i)f_i}{\sum_{i\in I}P(r_i,f_i)} }[/math];
  2. Falls alle Werte [math]\displaystyle{ V(r_i,f_i) }[/math] ungültig sind, wird [math]\displaystyle{ \bar{f} = \rm{invalid} }[/math] gesetzt.

Die Berechnung wird für Daten der Kategorien KC und KN durchgeführt, also für alle Datensätze, die für mehr als einen Termin vorhanden sind. Man erhält immer dann einen gültigen Wert für [math]\displaystyle{ \bar{f} }[/math], falls wenigstens ein gültiger Wert [math]\displaystyle{ V(r_i,f_i) }[/math] vorhanden ist. D. h. die Mittelwerte können Stichproben unterschiedlicher Größe entstammen. Programme wie NCPLOT ermöglichen bei der Visualisierung eine Filterung der dargestellten Daten mit Hilfe der Anzahl der gültigen Taylor Daten.

Korrelation

Es wird die Korrelation zwischen [math]\displaystyle{ r }[/math] und [math]\displaystyle{ f }[/math] berechnet:

  1. Der Mittelwert [math]\displaystyle{ \bar{r} }[/math] der Referenzdaten wird wie oben beschrieben berechnet;
  2. Der Mittelwert [math]\displaystyle{ \bar{f} }[/math] der Vergleichsdaten wird wie oben beschrieben berechnet;
  3. Die Standardabweichung [math]\displaystyle{ \sigma_r }[/math] der Referenzdaten wird wie oben beschrieben berechnet;
  4. Die Standardabweichung [math]\displaystyle{ \sigma_f }[/math] der Vergleichsdaten wird wie oben beschrieben berechnet;
  5. Für die Korrelation [math]\displaystyle{ R }[/math] folgt
    [math]\displaystyle{ R=\frac{\sum_{i\in I}P(r_i,f_i)\left(r_i-\bar{r}\right)\left(f_i-\bar{f}\right)}{\sigma_r\sigma_f\sum_{i\in I}P(r_i,f_i)} }[/math];
  6. Falls alle Werte [math]\displaystyle{ V(r_i,f_i) }[/math] ungültig sind, wird [math]\displaystyle{ R = \rm{invalid} }[/math] gesetzt.

Die Berechnung wird für Daten der Kategorien KC und KN durchgeführt, also für alle Datensätze, die für mehr als einen Termin vorhanden sind. Man erhält immer dann einen gültigen Wert für [math]\displaystyle{ R }[/math], falls wenigstens ein gültiger Wert [math]\displaystyle{ V(r_i,f_i) }[/math] vorhanden ist. D. h. der Korrelation können Stichproben unterschiedlicher zu Grunde liegen. Programme wie NCPLOT ermöglichen bei der Visualisierung eine Filterung der dargestellten Daten mit Hilfe der Anzahl der gültigen Taylor Daten.

Pattern RMS

Es wird die sogenannte Pattern RMS zwischen [math]\displaystyle{ r }[/math] und [math]\displaystyle{ f }[/math] berechnet:

  1. Der Mittelwert [math]\displaystyle{ \bar{r} }[/math] der Referenzdaten wird wie oben beschrieben berechnet;
  2. Der Mittelwert [math]\displaystyle{ \bar{f} }[/math] der Vergleichsdaten wird wie oben beschrieben berechnet;
  3. Für die Pattern RMS [math]\displaystyle{ E' }[/math] folgt
    [math]\displaystyle{ E'=\sqrt{\frac{\sum_{i\in I}P(r_i,f_i)\left[\left(r_i-\bar{r}\right)\left(f_i-\bar{f}\right)\right]^2}{\sum_{i\in I}P(r_i,f_i)}} }[/math];
  4. Falls alle Werte [math]\displaystyle{ V(r_i,f_i) }[/math] ungültig sind, wird [math]\displaystyle{ E' = \rm{invalid} }[/math] gesetzt.

Die Berechnung wird für Daten der Kategorien KC und KN durchgeführt, also für alle Datensätze, die für mehr als einen Termin vorhanden sind. Man erhält immer dann einen gültigen Wert für [math]\displaystyle{ E' }[/math], falls wenigstens ein gültiger Wert [math]\displaystyle{ V(r_i,f_i) }[/math] vorhanden ist. D. h. den Werten der Pattern RMS können Stichproben unterschiedlicher Größe zu Grunde liegen. Programme wie NCPLOT ermöglichen bei der Visualisierung eine Filterung der dargestellten Daten mit Hilfe der Anzahl der gültigen Taylor Daten.

Abweichung der Mittelwerte (Bias)

Es wird Abweichung der Mittelwerte [math]\displaystyle{ \bar{r} }[/math] und [math]\displaystyle{ \bar{f} }[/math] berechnet; diese Größe wird auch als Bias bezeichnet:

  1. Der Mittelwert [math]\displaystyle{ \bar{r} }[/math] der Referenzdaten wird wie oben beschrieben berechnet;
  2. Der Mittelwert [math]\displaystyle{ \bar{f} }[/math] der Vergleichsdaten wird wie oben beschrieben berechnet;
  3. Für die Abweichung der Mittelwerte [math]\displaystyle{ \bar{E} }[/math] folgt
    [math]\displaystyle{ \bar{E}=\bar{f}-\bar{r} }[/math];
  4. Falls alle Werte [math]\displaystyle{ V(r_i,f_i) }[/math] ungültig sind, wird [math]\displaystyle{ \bar{E} = \rm{invalid} }[/math] gesetzt;
  5. Die Gesamt RMS [math]\displaystyle{ E }[/math] folgt aus [math]\displaystyle{ \bar{E} }[/math] und [math]\displaystyle{ E' }[/math] gemäß
    [math]\displaystyle{ E = \sqrt{\bar{E}^2+E'^2} }[/math];

Die Berechnung wird für Daten der Kategorien KC und KN durchgeführt, also für alle Datensätze, die für mehr als einen Termin vorhanden sind. Man erhält immer dann einen gültigen Wert für [math]\displaystyle{ \bar{E} }[/math], falls wenigstens ein gültiger Wert [math]\displaystyle{ V(r_i,f_i) }[/math] vorhanden ist. D. h. den Werten des Bias können Stichproben unterschiedlicher Größe zu Grunde liegen. Programme wie NCPLOT ermöglichen bei der Visualisierung eine Filterung der dargestellten Daten mit Hilfe der Anzahl der gültigen Taylor Daten.

Root Mean Square Error (RMSE) nach Taylor

Die RMSE wird nach Taylor (2001, Gleichung 3) aus Pattern RMS und Bias berechnet. Die Berechnung wird für Daten der Kategorie KC und KN durchgeführt, also für alle Datensätze, die für mehr als einen Termin vorhanden sind. Man erhält immer dann einen gültigen Wert für RMSE, falls wenigstens eine gültige Differenz [math]\displaystyle{ d_i }[/math] vorhanden ist. D. h. den RMSE-Werten können Stichproben unterschiedlicher Größe zu Grunde liegen. Programme wie NCPLOT ermöglichen bei der Visualisierung eine Filterung der dargestellten Daten mit Hilfe der Anzahl der gültigen Differenzen.

Mathematisch ist die Definition der RMSE nach Taylor (2001, Gleichung 3) identisch zur üblicher Weise benutzten Definition. Numerisch können die auf unterschiedlichen Wegen berechneten Werte für RMSE allerdings geringfügig voneinander abweichen.

Skill 4 nach Taylor

Es wird der Skill S4 nach Taylor (2001, Gleichung 4) aus Korrelation und normierter Varianz berechnet. Die Berechnung wird für Daten der Kategorie KC und KN durchgeführt, also für alle Datensätze, die für mehr als einen Termin vorhanden sind. S4 kann wie folgt charakterisiert werden:

  • S4 = 1.0 kennzeichnet perfekte Übereinstimmung;
  • S4 = 0.0, falls Korrelation R = -1.0 oder die Varianz der Variante gegen 0.0 oder unendlich geht;
  • S4 ist linear bezüglich R (bei konstanter Varianz);
  • Bei verschwindender Varianz der Referenz ist S4 nicht definiert;
  • Abweichungen im Bias haben keinen Einfluss auf S4.

Diese Skill-Definition bestraft insbesondere Abweichungen in der Pattern RMS, während Abweichungen bezüglich der Korrelation eher toleriert werden. Siehe hierzu Taylor (2001, Abbildung 10).

Skill 5 nach Taylor

Es wird der Skill S5 nach Taylor (2001, Gleichung 5) aus Korrelation und normierter Varianz berechnet. Die Berechnung wird für Daten der Kategorie KC und KN durchgeführt, also für alle Datensätze, die für mehr als einen Termin vorhanden sind.

Im Gegensatz zu S4 werden Abweichungen der Pattern RMS und Unterschiede bezüglich der Korrelation R eher gleich stark behandelt (bestraft). Siehe hierzu Taylor (2001, Abbildung 11).

Anzahl der gültigen Referenzdaten

Die Anzahl der gültigen Referenzdaten [math]\displaystyle{ r_i }[/math] kann von Ort zu Ort variieren:

  1. Die Anzahl der gültigen Referenzdaten beträgt
    [math]\displaystyle{ N_r=\sum_{i\in I}P(r_i) }[/math];

Die Berechnung wird für Daten der Kategorien KC und KN durchgeführt, also für alle Datensätze, die für mehr als einen Termin vorhanden sind. Diese Größe hat rein informativen Charakter und wird für Taylor Diagramme nicht benötigt.

Anzahl der gültigen Vergleichsdaten

Die Anzahl der gültigen Vergleichsdaten [math]\displaystyle{ f_i }[/math] kann von Ort zu Ort variieren:

  1. Die Anzahl der gültigen Vergleichsdaten beträgt
    [math]\displaystyle{ N_f=\sum_{i\in I}P(f_i) }[/math];

Die Berechnung wird für Daten der Kategorien KC und KN durchgeführt, also für alle Datensätze, die für mehr als einen Termin vorhanden sind. Diese Größe hat rein informativen Charakter und wird für Taylor Diagramme nicht benötigt.

Anzahl der gültigen Taylor-Daten

Die Anzahl der gültigen Taylor Daten [math]\displaystyle{ \bar{r},\bar{f},\sigma_r,\sigma_f,R,E' }[/math] und [math]\displaystyle{ \bar{E} }[/math] kann von Ort zu Ort variieren:

  1. Die Anzahl der gültigen Taylor Daten beträgt
    [math]\displaystyle{ N_T=\sum_{i\in I}P(r_i,f_i) }[/math];

Die Berechnung wird für Daten der Kategorien KC und KN durchgeführt, also für alle Datensätze, die für mehr als einen Termin vorhanden sind. In Programmen wie NCPLOT können die o. g. Taylor Daten mit Hilfe dieser Größe bei der Visualisierung gefiltert werden. So können Darstellungen erzeugt werden, die z. B. das Ergebnis nur für Orte darstellen, an denen alle, oder eine bestimmte Anzahl von Ereignissen für die Berechnung der Daten zur Verfügung standen.

Median und Quantile

Voraussetzung für die Berechnung der nachfolgenden Größen ist, dass die gültigen Differenzen von [math]\displaystyle{ d_i }[/math] zunächst aufsteigend sortiert werden: Die [math]\displaystyle{ N_{\rm{ord}} }[/math] gültigen Differenzen [math]\displaystyle{ d_i }[/math] werden aufsteigend sortiert zu [math]\displaystyle{ s_j }[/math], mit [math]\displaystyle{ j \in [1:N_{\rm{ord}}] }[/math]. Vereinfachend wird nachfolgend [math]\displaystyle{ n:=N_{\rm{ord}} }[/math] benutzt.

Die Berechnung der nachfolgenden Größen wird nur für [math]\displaystyle{ n \ge 32 }[/math] durchgeführt.

Median

Es wird der Median für die gültigen Differenzen [math]\displaystyle{ d_i }[/math] berechnet:

  1. falls [math]\displaystyle{ n }[/math] ungerade: [math]\displaystyle{ d_{\rm{Med}} = s_\frac{n+1}{2} }[/math];
  2. falls [math]\displaystyle{ n }[/math] gerade: [math]\displaystyle{ d_{\rm{Med}} = 0.5\left( s_{\frac{n}{2}}+s_{\frac{n}{2}+1}\right) }[/math];
  3. falls weniger als 32 gültige Werte vorliegen, wird [math]\displaystyle{ d_{\rm{Med}} = \rm{invalid} }[/math] gesetzt.

Die Berechnung wird für Daten der Kategorien KC und KN durchgeführt, also für alle Datensätze, die für mehr als einen Termin vorhanden sind. Den Werten [math]\displaystyle{ d_{\rm{Med}} }[/math] können Stichproben unterschiedlicher Größe zu Grunde liegen. Programme wie NCPLOT ermöglichen bei der Visualisierung eine Filterung der dargestellten Daten mit Hilfe der Anzahl der gültigen Differenzen.

Quantil Q01

Es wird das Quantil [math]\displaystyle{ p=0.01 }[/math] für die gültigen Differenzen [math]\displaystyle{ d_i }[/math] berechnet, d. h. es wird diejenige Differenz [math]\displaystyle{ d_i }[/math] ermittelt, die in nur 1 % der Fälle unterschritten aber in 99 % der Fälle überschritten wird:

  1. falls [math]\displaystyle{ n \cdot p }[/math] ganzzahlig: [math]\displaystyle{ d_{\rm{Q01}} = 0.5\left( s_{n \cdot p}+s_{n \cdot p+1}\right) }[/math];
  2. falls [math]\displaystyle{ n \cdot p }[/math] nicht ganzzahlig: [math]\displaystyle{ d_{\rm{Q01}} = s_{\lceil n \cdot p \rceil} }[/math];
  3. falls weniger als 32 gültige Werte vorliegen, wird [math]\displaystyle{ d_{\rm{Q01}} = \rm{invalid} }[/math] gesetzt.

Die Berechnung wird für Daten der Kategorien KC und KN durchgeführt, also für alle Datensätze, die für mehr als einen Termin vorhanden sind. Den Werten [math]\displaystyle{ d_{\rm{Q01}} }[/math] können Stichproben unterschiedlicher Größe zu Grunde liegen. Programme wie NCPLOT ermöglichen bei der Visualisierung eine Filterung der dargestellten Daten mit Hilfe der Anzahl der gültigen Differenzen.

Quantil Q05

Es wird das Quantil [math]\displaystyle{ p=0.05 }[/math] für die gültigen Differenzen [math]\displaystyle{ d_i }[/math] berechnet, d. h. es wird diejenige Differenz [math]\displaystyle{ d_i }[/math] ermittelt, die in 5 % der Fälle unterschritten aber in 95 % der Fälle überschritten wird:

  1. falls [math]\displaystyle{ n \cdot p }[/math] ganzzahlig: [math]\displaystyle{ d_{\rm{Q05}} = 0.5\left( s_{n \cdot p}+s_{n \cdot p+1}\right) }[/math];
  2. falls [math]\displaystyle{ n \cdot p }[/math] nicht ganzzahlig: [math]\displaystyle{ d_{\rm{Q05}} = s_{\lceil n \cdot p \rceil} }[/math];
  3. falls weniger als 32 gültige Werte vorliegen, wird [math]\displaystyle{ d_{\rm{Q05}} = \rm{invalid} }[/math] gesetzt.

Die Berechnung wird für Daten der Kategorien KC und KN durchgeführt, also für alle Datensätze, die für mehr als einen Termin vorhanden sind. Den Werten [math]\displaystyle{ d_{\rm{Q05}} }[/math] können Stichproben unterschiedlicher Größe zu Grunde liegen. Programme wie NCPLOT ermöglichen bei der Visualisierung eine Filterung der dargestellten Daten mit Hilfe der Anzahl der gültigen Differenzen.

Quantil Q95

Es wird das Quantil [math]\displaystyle{ p=0.95 }[/math] für die gültigen Differenzen [math]\displaystyle{ d_i }[/math] berechnet, d. h. es wird diejenige Differenz [math]\displaystyle{ d_i }[/math] ermittelt, die in 95 % der Fälle unterschritten aber in 5 % der Fälle überschritten wird:

  1. falls [math]\displaystyle{ n \cdot p }[/math] ganzzahlig: [math]\displaystyle{ d_{\rm{Q95}} = 0.5\left( s_{n \cdot p}+s_{n \cdot p+1}\right) }[/math];
  2. falls [math]\displaystyle{ n \cdot p }[/math] nicht ganzzahlig: [math]\displaystyle{ d_{\rm{Q95}} = s_{\lceil n \cdot p \rceil} }[/math];
  3. falls weniger als 32 gültige Werte vorliegen, wird [math]\displaystyle{ d_{\rm{Q95}} = \rm{invalid} }[/math] gesetzt.

Die Berechnung wird für Daten der Kategorien KC und KN durchgeführt, also für alle Datensätze, die für mehr als einen Termin vorhanden sind. Den Werten [math]\displaystyle{ d_{\rm{Q95}} }[/math] können Stichproben unterschiedlicher Größe zu Grunde liegen. Programme wie NCPLOT ermöglichen bei der Visualisierung eine Filterung der dargestellten Daten mit Hilfe der Anzahl der gültigen Differenzen.

Quantil Q99

Es wird das Quantil [math]\displaystyle{ p=0.99 }[/math] für die gültigen Differenzen [math]\displaystyle{ d_i }[/math] berechnet, d. h. es wird diejenige Differenz [math]\displaystyle{ d_i }[/math] ermittelt, die in 99 % der Fälle unterschritten aber in nur 1 % der Fälle überschritten wird:

  1. falls [math]\displaystyle{ n \cdot p }[/math] ganzzahlig: [math]\displaystyle{ d_{\rm{Q99}} = 0.5\left( s_{n \cdot p}+s_{n \cdot p+1}\right) }[/math];
  2. falls [math]\displaystyle{ n \cdot p }[/math] nicht ganzzahlig: [math]\displaystyle{ d_{\rm{Q99}} = s_{\lceil n \cdot p \rceil} }[/math];
  3. falls weniger als 32 gültige Werte vorliegen, wird [math]\displaystyle{ d_{\rm{Q99}} = \rm{invalid} }[/math] gesetzt.

Die Berechnung wird für Daten der Kategorien KC und KN durchgeführt, also für alle Datensätze, die für mehr als einen Termin vorhanden sind. Den Werten [math]\displaystyle{ d_{\rm{Q99}} }[/math] können Stichproben unterschiedlicher Größe zu Grunde liegen. Programme wie NCPLOT ermöglichen bei der Visualisierung eine Filterung der dargestellten Daten mit Hilfe der Anzahl der gültigen Differenzen.

Weitere Skill-Definitionen

Skill 4 nach Murphy

Literatur:

  1. Murphy, Allan H. (1988) "Skill Scores Based on the Mean Square Error and Their Relationship to the Correlation Coefficient". Monthly Weather Review, Dec. 1988, Seiten 2417 - 2424.

Die Berechnung wird für Daten der Kategorie KC und KN durchgeführt, also für alle Datensätze, die für mehr als einen Termin vorhanden sind. Der Skill S4 nach Murphy (1988, Gleichung 4) kann wie folgt charakterisiert werden:

  • 1.0 kennzeichnet perfekte Übereinstimmung;
  • 0.0 besagt, dass der Mittelwert der (Referenz-) Daten diese genau so gut modelliert wie die Varianten-Daten, da beide "Modelle" denselben mittleren quadratischen Fehler aufweisen;
  • Negativer Skill bringt zum Ausdruck, dass der Mittelwert der (Referenz-) Daten diese besser modelliert als das Modell (Variante);
  • Abweichungen im Bias werden berücksichtigt.

zurück zu Pre- und Postprocessing


Strukturübersicht