Dataclub Blog: Introductie Dataclub Citizen Science
7 september 2023
  1. Blog
  2. Dataclub Blog: Introductie Dataclub Citizen Science

Sinds juni dit jaar is er een nieuw groepje vrijwilligers gestart als de Dataclub Citizen Science van het Milieucentrum Utrecht. Ons doel is om alle fietsende en metende mensen binnen de verschillende projecten van Samen Meten Utrecht meer inzichten te bieden over de data die ze verzamelen. Dit doen we met een groepje enthousiaste (provincie) Utrechters met uiteenlopende kennis en vaardigheden over data, data-analyse en onderzoeksmethoden. 

door Anjès Smits

Binnen de Dataclub zijn we ons in eerste instantie gaan focussen op de beschikbare data van het Snuffelfiets-project binnen de Provincie Utrecht. De Snuffelfietsers verzamelen al sinds begin 2020 allerhande interessante informatie tijdens hun fietstochten in en om de stad. Er is dus al een schat aan data beschikbaar waarmee mooie analyses gemaakt kunnen worden! 

We hoefden niet helemaal bij het begin te beginnen, want we zijn natuurlijk niet de eersten die met deze verzamelde data aan de slag zijn gegaan. Nog even los van de professionele instanties zoals de Provincie Utrecht en het RIVM, hebben groepen studenten van de minor Datavisualisatie en Infographics aan de Hogeschool Utrecht (HU) ook al met deze data gewerkt. Zij hebben eerder al een template ontworpen voor kwartaalrapportages van de metingen van de Snuffelfietskastjes. Hier borduren wij nu handig op voort.

 

Snuffelfietsdata

De data die verzameld wordt door de Snuffelfietsers omvatten onder andere de fijnstofgehaltes, de routes, afstanden en tijden. Deze data komt allemaal terecht op het dataplatform van Civity. De minorstudenten van de HU haalden de data per week op in CSV-bestanden. Op basis van deze bestanden voerden zij hun analyses uit. Wij hebben besloten dit op een andere, technisch complexere manier aan te pakken; namelijk door gebruik te maken van de beschikbare API (Application Programming Interface). Een API is een softwarematige koppeling die communicatie mogelijk maakt tussen verschillende programma’s of applicaties. Het ene programma kan hiermee op een afgesproken manier gegevens opvragen bij het andere programma dat over de gegevens beschikt, in dit geval dus de Snuffelfietsdata van Civity. 

  Door gebruik te maken van scripts (stukjes code waarin je bijvoorbeeld vraagt om het aantal actieve Snuffelfietskastjes), kunnen we tegen deze API ‘aanpraten’. De API geeft ons dan de opgevraagde resultaten terug, waarmee wij de analyses kunnen doen. Dit heeft een aantal voordelen; we hoeven niet steeds allemaal de weekbestanden met alle Snuffelfietsdata te downloaden en de analyses hierop los te laten, maar we kunnen dit geautomatiseerd doen. Het is daardoor sneller, minder foutgevoelig en eenvoudiger te herhalen voor toekomstige analyses.

 

Een betrouwbare dataset

Om goede analyses uit te kunnen voeren, is het van groot belang dat we werken met een betrouwbare dataset. De eerste vraag waar we ons dus mee bezig hebben gehouden is de vraag welke metingen we als betrouwbaar kunnen inschatten. Een goed voorbeeld hiervan is de snelheid die we terugzien in de metingen. Ligt deze snelheid ineens boven de 35 kilometer per uur, dan is de betreffende Snuffelfietser wellicht met de fiets in de trein gestapt. De overige metingen van deze rit (fijnstofgehaltes etc.) kunnen we hierdoor niet meer als betrouwbaar inschatten en filteren we daarom uit de dataset. 

 

Wat gaan we doen met de data?

Ons eerste doel is om analyses per kwartaal te maken en deze beschikbaar te stellen aan alle Snuffelfietsers. Hierin kijken we naar wat basale statistieken als gemiddelden en naar interessante uitschieters. In het eerste half jaar van 2023 zijn er bijvoorbeeld gemiddeld per kwartaal zo’n 70 Snuffelfietsers actief geweest.

De gemiddelde fietssnelheid ligt tussen de 11 en 12 kilometer per uur. De hoogst behaalde gemiddelde snelheid tijdens een rit is bijna 30 kilometer per uur, deze Snuffelfietser heeft in juli een mooie tocht gemaakt!

In totaal zijn er in Q1 1786 ritten gemaakt, goed voor ongeveer 920 uur en 10.415 afgelegde kilometers. In Q2 zijn dat 1850 ritten, waar in 1065 uur zo’n 12.624 kilometers zijn afgelegd. Mooie scores! Kunnen we daar nog overheen in Q3 en Q4?

De Snuffelfietsers blijven daarentegen niet alleen in onze mooie provincie fietsen. Ook in de rest van Nederland en zelfs in het buitenland wordt volop gefietst en gemeten. Zie bijvoorbeeld onder de afgelegde routes in de maand juli 2023.

We hebben een hele rits aan andere onderzoeksvragen geformuleerd waar we in het vervolg mee aan de slag kunnen. Zo zijn we benieuwd naar de invloed van de weersomstandigheden op de gemeten fijnstofgehaltes, het vergelijken van verschillende fietsroutes, en de verschillen die zichtbaar zijn op langere termijn (denk bijvoorbeeld aan veranderingen in verkeerssituaties en het effect daarvan). Ook dromen we van een combinatie met de data die alle Telramen in Utrecht ons opleveren!

 

Blijven fietsen en meten dus!

Hoe meer data er beschikbaar is, hoe relevanter onze analyses kunnen worden. Heb jij nou ook een interessante vraag waarmee we aan de slag kunnen? Of wil je ook iets bijdragen? Neem contact met ons op via info@samenmetenutrecht.nl of projecten@mcu.nl!

Deze blog werd geschreven door Anjès Smits. Ze is vrijwilliger bij het Milieucentrum Utrecht en Coördinator van de Dataclub Citizen Science. Samen met een team van data-enthousiastelingen probeert ze inizichten te verwerven uit de data van burgerwetenschapsprojecten.

Ander nieuws