Direct naar hoofdinhoud
Filter: overheid
Filter: data & ai
delen

Hoe KNMI grip krijgt op softwarekwaliteit met Site Reliability Engineering

Een generiek platform voor observability en monitoring, meer grip op applicatieprestaties en organisatiebrede bewustwording van softwarekwaliteit; dat is het resultaat van de samenwerking tussen KNMI en ilionx. Ze gingen gezamenlijk aan de slag met de implementatie van Site Reliability Engineering (SRE): niet alleen een technische oplossing, maar ook een cultuurverandering. 

“Voordat we begonnen was het bij KNMI de insteek om de softwarekwaliteit te verbeteren door technologie in te zetten. Maar op dag één merkten we al dat het meer om een cultuurverandering ging. Het resultaat is nu dat er een organisatiebrede mindset gericht op kwaliteit is ontstaan en dat we kwaliteit inzichtelijk hebben gemaakt.”

Hein Bloemen Manager IKM IT Platform Services bij KNMI
KNMI logo
Header KNMI
een gestandaardiseerd platform voor observability en monitoring
organisatiebrede bewustwording van softwarekwaliteit
meer grip op prestaties van applicaties

KNMI

Het Koninklijk Nederlands Meteorologisch Instituut (KNMI) (Verwijst naar een externe website)is hét nationale centrum voor weer, klimaat en seismologie. Met ruim 250 developers ontwikkelt KNMI software voor uiteenlopende toepassingen, van radarbeeldverwerking tot monitoring van vulkaanuitbarstingen. 

van gevoel naar grip 

Hoewel KNMI al jaren software ontwikkelt, miste het management overzicht over de kwaliteit en prestaties van applicaties. “Er was te weinig inzicht in wat applicaties opleverden en of ze aan verwachtingen voldeden,” vertelt Jeroom van Amstel, teamlead CST en Product Owner bij ilionx. “Een voorbeeld is een van de platformen waarin veel weerdata wordt verzameld, bewerkt en verspreid. Zo’n platform bevat talloze kleinere applicaties die bijvoorbeeld neerslag of wolkenvorming analyseren. Vanwege de maatschappelijke relevantie en het grote aantal kritieke services binnen deze platformen is continu inzicht onmisbaar. Het ging daarbij om de prestaties van deze applicaties, zoals verwerkingstijd, foutmarges en beschikbaarheid, en hun betrouwbaarheid.”

Daarom koos KNMI voor de implementatie van SRE. Deze aanpak richt zich op het verbeteren van betrouwbaarheid, beschikbaarheid en schaalbaarheid door software-engineeringprincipes toe te passen op operationele processen. “Zo wilde KNMI niet alleen technische grip krijgen, maar ook incidenten voorkomen en in de ontwikkelfase al zorgen dat de software aan hoge kwaliteitsnormen voldoet.”

bewustwording binnen de teams

Op dat moment kwam ilionx in beeld. En de samenwerking begon met een duidelijke vraag: help ons om de softwarekwaliteit te verbeteren. Toch bleek dat eenvoudiger gezegd dan gedaan. “De behoefte aan SRE leefde vooral bij het management,” aldus Jeroom. “Binnen de ontwikkelteams was het idee nog vrij onbekend. Daarom zijn we begonnen met het creëren van bewustwording. Specifiek over de impact van softwarekwaliteit op de betrouwbaarheid van kritieke applicaties, de risico’s van gebrekkige monitoring en het belang van inzicht in prestaties gedurende de hele levenscyclus van software.”

Deze aanpak werkte. Waar teams eerst sceptisch waren, ontstond gaandeweg enthousiasme. Door samen met de teams te kijken naar de applicaties en te vragen waar hun behoeften lagen, ontstond er ruimte voor verandering. Jeroom: “In plaats van direct systemen op te leggen, kozen we voor het bouwen van tools die aansloten bij de wensen van de teams en waar zij direct voordeel van ondervonden. Zo werd een observability-dashboard ontwikkeld dat inzicht gaf in codekwaliteit. Normaal moeten teams zelf hun broncode koppelen aan tools voor kwaliteitscontrole. Dat hebben wij nu deels geautomatiseerd, onder andere met behulp van AI.” 

"Het resultaat is een generiek observability-platform. Een centraal platform waar de teams hun applicaties op kunnen aansluiten. Hiermee wordt het voor hen eenvoudiger om de applicaties continu te monitoren op prestaties, beschikbaarheid en betrouwbaarheid."

Jeroom van Amstel Teamlead CST en Product Owner bij ilionx

van inzicht naar eigenaarschap

Het resultaat is een generiek observability-platform. Een centraal platform waar de teams hun applicaties op kunnen aansluiten. Hiermee wordt het voor hen eenvoudiger om de applicaties continu te monitoren op prestaties, beschikbaarheid en betrouwbaarheid. “Het vormt een essentieel onderdeel van de SRE-aanpak, waarin monitoring, signalering en inzicht in metrics cruciaal zijn om softwarekwaliteit structureel te verbeteren en incidenten te voorkomen. Hiermee krijgt KNMI centraal inzicht in de prestaties van applicaties. Denk aan software voor communicatie met andere overheidsdiensten en radarbeeldverwerking,” vertelt Jeroom. “Door standaardisatie hoeven teams minder handmatig te koppelen en ontstaat er uniformiteit in kwaliteitsbewaking. Dat leidt tot minder verstoringen, minder ad-hocvragen en meer rust in de operatie.”
 
Ook de bewustwording is inmiddels breed doorgedrongen in de organisatie. “Tijdens een recente sprint review leidde een presentatie over het observability-dashboard direct tot vijftien aanvragen voor toegang door andere teams. En inmiddels maken tientallen teams gebruik van het platform en groeit het door. De volgende stap is het integreren van automatische waarschuwingen bij afwijkingen en het volledig overdragen van het beheer aan KNMI zelf. Want dit project draaide niet alleen om techniek, maar vooral om het introduceren van een nieuwe manier van denken en werken.”

Wil je meer weten over dit project?

Laat je gegevens achter en dan neem ik contact met je op.

Portretfoto Bernard Zuidema
Bernard Zuidema Marktdirecteur Centrale Overheid