Trends en trends
23/06/2011Ik zag laatst ergens een paar grafieken waaruit bleek dat de temperatuur in De Bilt de laatste 10 jaar, zelfs de laatste 14 jaar, niet meer omhoog was gegaan. Daartoe werd de zogeheten lineaire trend (enkelvoudig lineaire regressie) berekend over de periodes jan 2001 t/m dec 2010 respectievelijk jan 1997 t/m dec 2010. Voor de berekeningen werd netjes de gehomogeniseerde reeks van De Bilt gebruikt. Een reeks waarin de ruwe data gecorrigeerd zijn in verband met veranderingen en verplaatsingen van meetapparatuur en waarbij tevens rekening wordt gehouden met stadseffect vanwege toegenomen bebouwing in de omgeving.
De reeks van De Bilt is gemakkelijk in bv. Excel of Calc te laden, waarna met een simpele formule een lineaire trend gevonden kan worden. Ik heb de grafieken zelf gereproduceerd en vond inderdaad over 2001-2010 een lineaire trend van -0,1°/10jr en over 1997-2010 een trend van 0,0. De beweringen van geen opwarming (sinds 1997) of zelfs een kleine afkoeling (sinds 2001) lijken dus te kloppen. Of toch niet?
Eenieder die wat beginnerskennis van statistiek heeft, weet dat je NOOIT zomaar een trend kunt berekenen over een reeks getallen die te maken hebben met seizoensinvloeden. En als er iets is dat seizoensinvloeden kent, is het wel een reeks van opeenvolgende maandtemperaturen.
Om dit even te laten zien, heb ik voor alle maanden vanaf januari 1910 t/m mei 2011 de trend over de voorafgaande 10 jaar in beeld gebracht (klik op plaatjes voor een uitvergroting):
We zien dat de trend over de voorafgaande 10 jaar steeds op en neer gaat. Het blijkt een jaarlijks patroon op te treden. De niet voor seizoen gecorrigeerde trend heeft elk jaar een dieptepunt in april en een hoogtepunt zes maand later, in oktober.
De oorzaak hiervan is simpel. De trend berekend voor april in het jaar xx loopt van mei jaar xx-10 tot en met april jaar xx. De seizoensinvloeden kennen tussen april en mei de grootste toename, gemiddeld is mei ruim 4 graden warmer dan april. De eerste maand van de reeks voor de trend is dus altijd zo’n 4 graden warmer dan de laatste maand in de reeks. Dit heeft een enorme negatieve invloed op de trend, die over een relatief korte tijdspanne gaat. In oktober hebben we het omgekeerde: november is gemiddeld ruim 4 graden kouder dan oktober; hier wordt een trend dus altijd positief beïnvloed.
Als je gegevens bestaan uit maandelijkse temperaturen, mag je dus niet zomaar een trend berekenen over al die maanden achter elkaar. Er zijn diverse statistische methodes om een trend zonder seizoensinvloed te berekenen.
1. bereken de trend enkel over vergelijkbare maanden; de lineaire trend per 10 jaar 2001-2010 wordt dan: januari -1,6°, februari -1,9°, maart +0,2°, april +2,1°, mei -0,6°, juni +0,3°, juli +1,1°, augustus -1,9°, september 0,0°, oktober -1,0°, november -0,1° en december -2,7°
2. bereken de trend over gemiddelden van kalenderjaren: de lineaire trend per 10 jaar over 2001-2010 wordt dan -0,5°
3. bereken een doorlopend gemiddelde van steeds 12 maanden en bereken daarover een trend; over jan 2001 t/m dec 2010 levert dit een trend op van -0,2° per 10 jaar
Als we over zo’n doorlopend gemiddelde als hierboven in punt 3 elke maand een trend over de afgelopen 10 jaar (120 maanden) berekenen, levert ook dat een golvende grafiek op. De seizoensinvloeden zijn nu weg, maar de enorme wisselingen in temperatuur van jaar tot jaar hebben ook grote invloed op elke trend:
Uit de grafiek blijkt dat de volgens punt 3 berekende trend inmiddels nog wat lager is dan afgelopen december: was het toen -0,2°/10jr (over jan 2001 t/m dec 2010), de meest recente is -0,4°/10jr (over juni 2001 t/m mei 2011).
De enorme wisselingen in de bovenstaande grafieken laten zien, dat het nogal wat uitmaakt welke periode je precies kiest om een 10-jarige trend te melden. Als je niet voor seizoen corrigeert (eerste grafiek) kun je 10-jarige trend tussen de +3 en -3°/10jr uitkiezen. Corrigeer je wel voor seizoen (tweede grafiek) dan wordt de keuze wat kleiner, maar nog altijd tussen +1,5 en -1,5°/10jr.
Dat de 10-jarige trend eind 2010 negatief was, heeft natuurlijk alles te maken met het feit dat het jaar 2010 de koudste was sinds 1996. Des te korter de periode is waarover een lineaire trend wordt berekend, des te meer effect hebben de gegevens aan het begin en eind van zo’n periode. Trends over korte periodes bieden daarom bij uitstek de mogelijkheid tot ‘cherry picking’: kies net die periode die het best bij jouw denkbeelden past. Criticasters van klimaatverandering zijn daarin bijzonder bedreven; oudere of juist meer recente gegevens die hun zorgvuldig samengestelde grafiekje met trend zouden kunnen ‘bederven’ laten ze voor het gemak vaak weg. Ik noem zoiets: creatief spelen met Excel.
Soms zijn er simpelweg niet genoeg gegevens van langere tijd terug. Zo beginnen de gegevens gemeten vanaf satellieten in 1979. Maar in het geval van temperaturen De Bilt begint de gehomogeniseerde meetreeks in 1901.
De Wereld Meteorologische Organisatie (WMO) schrijft voor dat klimatologische gemiddelden minstens over een periode van 30 jaar berekend moeten worden. Uitschieters naar boven of beneden hebben dan weinig invloed op zo’n gemiddelde. Laten we dit eens voor De Bilt (homogeen) in een grafiek zetten, een doorlopend 30-jarig gemiddelde (dus elke maand over diezelfde maand plus voorafgaande 359 maanden):
Dit is wat we noemen klimaatverandering. Het is niet van jaar tot jaar merkbaar, het gaat niet elk jaar dezelfde kant op, soms zelfs korte tijd de andere kant. Op korte termijn (bv. 10 jaar) kunnen trends snel op en neer gaan. Maar langzaam en gestaag zet het voort en dat is enkel op de lange termijn duidelijk.