Blog

Ontdek basisconcepten van de datascientist rol

Data science betekent niet alleen maar complexe modellen maken. Maar als dat niet het enige is, wat is het dan wel?

Gepubliceerd: 18 oktober 2022

In dit artikel bewonderen we de magie van data science. We duiken in de wereld van wat het betekent een datascientist te zijn door de volgende onderwerpen te bespreken:

  1. De meerwaarde van Data Science;
  2. De verantwoordelijkheden van een Datascientist;
  3. De gereedschapskist van een Datascientist.

Intercept heeft richtlijnen ontwikkeld die helpen bij het bepalen van jouw datareis, waar Data Science een onderdeel van is. Bekijk hier hoe we Data Life Cycle Management voor jou kunnen inzetten.

 

De meerwaarde van Data Science 

Bij Intercept vinden we dat een datascientist data moet verzamelen en modellen moet creëren die inzichten bieden. Deze inzichten kunnen we gebruiken om uiteindelijk betere zakelijke beslissingen kunnen worden genomen.

Laten we eens kijken naar een voorbeeld van data science, die hier van toepassing is:

Sommige bankapplicaties delen jouw aankopen in categorieën op; zoals boodschappen, nutsvoorzieningen en transport. Deze resultaten worden vervolgens weergegeven in de bankapplicatie op jouw telefoon. Tegenwoordig kunnen deze applicaties zelfs voorspellingen van uitgaven per categorie tonen of toekomstige transacties voorspellen.

Dit lijkt vanzelfsprekend, maar het is goed om te weten dat dit alleen mogelijk is met behulp van data science en het bouwen van een intelligent systeem.

 

De verantwoordelijkheden van een Datascientist

Bij Intercept zijn we van mening dat dit een aantal kernverantwoordelijkheden van een datawetenschapper als volgt zijn:

  • Tools kiezen die deel uitmaken van de data science-omgeving;
  • Modellen ontwikkelen en begrijpen;
  • Een veilige data science infrastructuur, data en modellen creëren;
  • Stakeholders informeren over de ontwikkelde en geïmplementeerde modellen.

Het begint allemaal met het kiezen van een veilige data science-omgeving. De eerste stap hier is het kiezen van de productieomgeving. Bij Intercept geloven we dat Azure Machine Learning een geweldige data science omgeving is om in te werken, want het maakt de samenwerking makkelijker.

Een van de meest belangrijke verantwoordelijkheden van een datascientist is het ontwikkelen van data science gerelateerde modellen. Maar is het nog belangrijker dat je gebruikt maakt van verschillende algoritmen en frameworks . Bijvoorbeeld: als je tijdreeksen onderzoekt en de verkoopvraag wilt voorspellen van een product, kan je naar multivariate regressies kijken.

Een datascientist zal ook moeten nadenken over de beveiliging van de data science-oplossing. Het beveiligen van data, modellen en data science omgevingen zorgt ervoor dat je jezelf beschermt tegen diverse beveiligingsaanvallen.

Gedeelde verantwoordelijkheden

Sommige van de genoemde verantwoordelijkheden zijn gedeelde verantwoordelijkheden. Netwerkbeveiliging moet bijvoorbeeld worden afgestemd met je infrastructuurmedewerker. Ondertussen moet de beveiliging van jouw data science-oplossing worden afgestemd met de beveiligingsfunctionaris. Het is daarom van belang om alle stakeholders te informeren over je ontwikkelde en geïmplementeerde modellen. Het is niet alleen belangrijk om resultaten te rapporteren. Denk ook aan data lineage, trainingsdataset maken of markering van modellen te controlen, want deze zijn gevoelig voor bias.

Bij Intercept kunnen we je helpen om verantwoordelijkheden te identificeren die ervoor zorgen dat alle verantwoordelijkheden zijn gedekt.

Meer weten over beveiligingsaspecten? Binnenkort komt er een artikel dat hier dieper hierop ingaat. 

 

De toolbox van een Datascientist

Intercept is van mening dat het handig is om als datascientist voldoende kennis te hebben over:

  1. Programmeertalen;
  2. Data Science-omgeving.

Het begrijpen en kunnen toepassen van een programmeertaal stelt een datascientist in staat om geschreven code in meerdere (andere) programmeertalen te begrijpen. Het heeft daarnaast ook invloed op je keuze voor een data science platform.

Bij Intercept gebruiken we Python omdat het een stabiele taal is met een solide gebruikersbasis. Daarnaast heeft het veel machine learning-functionaliteiten en integraties met data science-tools en platforms.

Binnen het Microsoft Azure-platform zijn verschillende AI-services beschikbaar die als bouwsteen in jouw AI-oplossing kunnen fungeren. Bij Intercept richten we ons vooral op Azure Machine Learning als het platform voor je data science-projecten. Deze service integreert met python en is voorzien van een gemakkelijke drag-and-drop-omgeving met algoritmen zoals voorspelling, door middel van ML Studio.

In het geval van vooraf gebouwde algoritmen en modellen die specifiek toepasbaar zijn op een bepaalde functie en use-case, zijn er ook andere services zoals Azure Cognitive Services en Azure Bot Service op het Azure platform aanwezig.

Bij Intercept vinden we het belangrijk dat een datascientist de tools in hun toolbox grondig begrijpen en kunnen toepassen. Alleen op deze manier kunnen zakelijke uitdagingen worden aangepakt.

Intercept is er om je te helpen! We kunnen je helpen jouw toolbox af te stemmen op het scenario waar jij mee aan de slag moet gaan.

 

Hoe pakt Intercept de use-cases van Data Science aan?

Bij Intercept hanteren we de DLM-aanpak. Op deze manier pakken we je Data Science-project stap voor stap beet. Samen met onze Datascientist kunnen we je begeleiden bij de bedrijfsbehoeften en deze vertalen naar een Data Design. Goed nieuws: het Data Design fungeert als blauwdruk voor jouw Data Science-project. Plan een afspraak met ons om te bepalen voor welke uitdagingen wij een Data Science oplossing voor jullie kunnen bieden.