Werkweek van Fatima, Data Scientist bij Experience Data
We vinden het leuk om jou als lezer een kijkje in de keuken te geven bij Experience Data. Soms doen we dat door een interview (bijvoorbeeld deze van Maud), maar soms vragen we iemand iets te vertellen over zijn of haar werkweek. Na Robert Jan is nu data scientist Fatima aan de beurt.
Maandag
Maandagochtend hebben we ons wekelijks teamoverleg. Omdat ik collega Joost assisteer bij een project als projectmanager, vertel ik aan de rest van het team waar we staan. Ik leg uit dat het allemaal goed verloopt en vraag wie er nog ruimte heeft als we deze week toch nog wat extra ondersteuning nodig hebben.
In de middag bereid ik een kick-off-sessie voor met het projectteam van een nieuw project voor komende woensdag. We gaan na wat we allemaal willen gaan bespreken, wie er aanwezig zijn en wat hun technische achtergrond is. Op basis hiervan maken we een presentatie van onze aanpak die voor iedereen begrijpelijk is en niet alleen voor de data scientists.
Dinsdag
Vandaag ben ik zoals vaker bij een verzekeringsklant. Hier heeft Experience Data een kunstmatige assistent voor gebouwd waarvoor ik onder andere het machine learning model heb ontwikkeld. Nu zijn Robert Jan en ik hier voor een gebruikersoverleg met de teamleiders. Daarin kunnen zij vragen stellen over de werking van de kunstmatige assistent als er zaken niet helemaal duidelijk zijn. Met die feedback kunnen wij de applicatie weer beter maken en helpen we ze om na te denken over een data gedreven werkwijze.
Eenmaal terug op kantoor kruip ik voor dezelfde klant achter de computer om te programmeren. Ze zullen op den duur de kunstmatige assistent in hun eigen systemen laten draaien en daar moet het script op worden aangepast. Elke klant heeft weer een andere technologische architectuur en het is weer een leuke uitdaging om onze kunstmatige assistent daar goed op te laten aansluiten.
Woensdag
Vandaag hebben we de kick-off, die we maandag al voorbereid hadden, bij het distributiecentrum van een klant. Er is een keurmeester aanwezig; hij zal de gebruiker van onze applicatie worden. Ook zit er een operationeel directeur aan tafel als projectleider en een data analist. Tijdens deze sessie bespreken we welke data ze eigenlijk vastleggen op dit moment en we letten goed op eventuele aannames die worden gedaan. We maken als het ware de link tussen hun huidige processen en de data. Het is heel fijn om al deze stakeholders in dezelfde ruimte te hebben. Want hoewel de data analist ons kan vertellen hoe een bepaalde kolom heet, weet hij niet precies wat bepaalde categorieën bijvoorbeeld inhouden. En dat kan de keurmeester ons dan weer vertellen. Daarnaast zou zonder de goedkeuring van de operationeel directeur dit project waarschijnlijk niet van de grond zijn gekomen. Zo zie ik opnieuw hoe data science meerdere lagen van een organisatie nodig heeft om impact te creëren.
Donderdag
Vanmorgen heb ik een afspraak met onze front-end-developer, of in gewone mensentaal: de collega die ervoor zorgt dat onze kunstmatige assistenten er mooi uitzien en werken zoals de bedoeling is. We hebben van de klant namelijk een paar nieuwe wensen gekregen voor de applicatie en die ga ik aan hem uitleggen. We bespreken hoeveel werk dit voor hem gaat zijn en wat voor veranderingen dit gaat brengen voor de zogenaamde back-end. Dat gedeelte heb ik geschreven en die moet altijd goed aansluiten op de front-end die door hem geschreven is. Hoewel het bord vol tekeningen er waarschijnlijk chaotisch uitziet, is het ons inmiddels helemaal duidelijk en kunnen we beiden weer verder.
In de middag ga ik met een collega zitten om de architectuur voor een nieuw script op te zetten. Voor een klant zijn we bezig om tekst uit een foto te lezen, dit heet ook wel OCR. Samen bedenken we welke functies er allemaal in het script komen te zitten en hoe die onderling en met onze kunstmatige assistent gaan samenwerken. We schrijven dit in Python in een soort nep-code. Gewoon zodat wij snappen waar wat gebeurt en we het werk onderling kunnen verdelen.
Vrijdag
We starten de dag met alle data scientists samen; we hebben het zogenaamde data science uurtje (wat overigens nooit in een uurtje klaar is). Elke week kunnen we aandragen als we ergens over willen sparren met de anderen. Dit keer draag ik samen met de collega van gisteren het onderwerp OCR aan. We weten dat dit ook bij een ander project wordt toegepast en samen bespreken we onze aanpak en techniek. Kunnen we misschien iets van elkaar overnemen? Of misschien hebben anderen juist tips wat we vooral niet moeten doen. Iemand heeft toevallig nog een interessant paper over OCR gelezen en vertelt hier enthousiast over. Zo verlaten we allemaal de sessie vol nieuwe ideeën om uit te proberen. Hopelijk kunnen we met deze tips de tekst nog beter of sneller uit de plaatjes halen.
Tot slot ga ik weer even zitten met Joost om te overleggen hoe het ervoor staat met het project waar hij aan werkt. We spreken af welke hoofdpunten ik maandag in het teamoverleg ga bespreken en ik overleg met hem of hij nog ergens ondersteuning bij nodig heeft. We spreken af dat we wel wat hulp kunnen gebruiken van onze data consultants om met ons de bevindingen in een mooie presentatie te verwerken. Dat zal ik volgende week dan ook melden aan het team. Maar voor nu is deze week voorbij en is het tijd voor een lekker koud glaasje en een lekker Zwitsers chocolaatje. Of misschien wel 3.