Blog

Migreer je data science omgeving en modellen naar Azure

Het waarom en wat van het migreren van jouw data science workloads naar Azure. 

Ontwikkel jij je data science oplossingen nog steeds op je lokale machine? Misschien is het tijd om na te denken over het verplaatsen naar de Azure cloud. Dit artikel licht toe wat Azure te bieden heeft op het vlak van data science. Daarbij behandelen we de volgende onderwerpen:  

  • Waarom je een Azure data science omgeving nodig hebt;  
  • Welke Data Science tools biedt Azure? 

Ben je benieuwd waarom je Data Science in de eerste plaats zou moeten gebruiken? Ontdek het in ons vorige artikel waar we de basisconcepten van een data scientist rol verkenden.  

 

Waarom heb je een data science omgeving nodig 

 Bij Intercept geloven we dat de overstap naar Azure de volgende voordelen biedt:  

  • Eén onderhoudbaar platform  
  • Een veilige oplossing 
  • Meer samenwerking 
  • Alle pakketten zijn vooraf geïnstalleerd   

Allereerst biedt Azure je één enkel platform voor je hele data science oplossing. Omdat het integreert met veel Azure-diensten, kan je de volledige oplossing op één platform bouwen. Je kunt bijvoorbeeld je gegevens opslaan met behulp van opslagaccounts, machine learning pipelines draaien in Azure Machine Learning en elke medewerker toegang geven met behulp van een rol-based toegangscontrole. Aangezien je hele technologiestack op één plek in de Azure-cloud draait, is het onderhoud van je data science-oplossing efficiënter en transparanter.  

Daarnaast is beveiliging van groot belang voor elke data science-oplossing. Azure biedt ons tal van hulpmiddelen om onze oplossing veilig en weerbaar te houden tegen aanvallen van buitenaf. Men kan bijvoorbeeld de Azure Key Vault gebruiken om geheimen op te slaan die onze wachtwoorden veilig houden. Om rechten voor toegang tot onze data science-omgeving te verdelen, kunnen we Role-Based Access Controls (RBAC) gebruiken. Samen helpen deze tools ons om onze data science-omgeving op een gebruiksvriendelijke manier te beveiligen. 

Azure biedt één enkel platform voor het bouwen, ontwikkelen en implementeren van modellen. Dit verhoogt niet alleen de onderhoudbaarheid, maar bevordert ook de samenwerking. Stel je dit voor: Aangezien iedereen in je team op hetzelfde platform werkt, hoef je nooit meer bestanden, datasets of uitkomsten over te dragen tussen collega's! 

Wil je specifieke pakketten gebruiken in je data science workloads? Samenwerken op hetzelfde platform zorgt ervoor dat alle vereiste pakketten vooraf kunnen worden geïnstalleerd en klaar zijn voor gebruik. Op Azure zijn geen aparte frameworks of ML-pakketinstallaties nodig. Eenmaal geïnstalleerd kan iedereen in jouw team de code draaien zonder tijd te besteden aan het opzetten van een lokale omgeving. 

 

Welke Data Science tools heb je in Azure?  

 
Azure biedt verschillende data science en analytics tools. Benieuwd welke tool geschikt is voor jouw use case? In dit deel bespreken we vijf vaak gebruikte data science tools op Azure: 

  1. Azure Machine Learning (AML) 
  2. Azure Cognitive Services 
  3. Azure Databricks 
  4. Azure Synapse Analytics 
  5. Azure Data Science Virtual Machine (DsVM)

 

Azure Machine Learning (AML) 

Bij Intercept gebruiken we AML graag voor onze Data Science workloads, omdat het een gebruiksvriendelijke tool is. AML kan worden gezien als een end-to-end data science-platformoplossing in de cloud om uw hele data science-project te versnellen en te beheren. Met AML kan men data science workloads ontwikkelen met behulp van Python. Het uitvoeren van code gebeurt met behulp van Jupyter notebooks. De rekenkracht van AML komt van het rekencluster. Met het rekencluster kun je gedistribueerde training van je data science modellen uitvoeren. Aangezien de Python SDK vooraf is geïnstalleerd, zijn je notebooks direct na installatie klaar voor uitvoering. 
 

Azure Cognitive Services 

Als je een specifieke zakelijke uitdaging hebt op het gebied van besluitvorming, taal, visie of spraak, is het verstandig om Azure Cognitive Services te onderzoeken. Azure Cognitive Services biedt Artificial Intelligence (AI) diensten op Azure, met behulp van vooraf gebouwde en getrainde machine learning modellen van Microsoft. Je kunt ontwikkelingstalen gebruiken voor interactie met deze diensten via REST API's en SDK's voor clientbibliotheken in jouw data science en analytics-omgeving. Azure Cognitive Services is een geweldige optie om cognitieve intelligentie toe te voegen aan jouw toepassingen, zelfs als je geen AI of data science kennis hebt. Het is wel goed om te weten dat de algoritmen die binnen Azure Cognitive Services worden gebruikt, niet kunnen worden aangepast. 

Azure Databricks 

Als je grootschalige machine learning workflows wilt uitvoeren, is Azure Databricks misschien het bekijken waard. Aangezien Azure Databricks gebruik maakt van de krachten van Apache Spark, beschik je over een gedistribueerd kader voor gegevensverwerking. Op Azure Databricks kun je je Spark-omgeving binnen enkele minuten opzetten, genieten van autoscaling en samenwerken met je collega's via notebooks. Bovendien integreert het goed met bijna elke Azure dienst, waardoor Azure Databricks een goed geïntegreerd en gebruiksvriendelijk platform is. 

Azure Synapse Analytics 

Heb je een alles-in-één platform nodig? Dan is Azure Synapse Analytics de tool voor jou. Deze tool integreert goed binnen het Azure platform en zorgt voor een goede aansluiting op alle diensten die nodig zijn voor een end-to-end data science project. Ook is Azure Synapse Analytics relatief compact, met data-integratie, warehousing, analytics en data science tools in één product. 

Azure Data Science Virtual Machine (DsVM) 

Als je een gemakkelijke start wilt maken met het verplaatsen van je data science-oplossing naar de cloud, is een enkele Data Science Virtual Machine (DsVM) op Azure misschien iets voor jou. DsVM is een cloud-gebaseerde kopie van jouw lokale omgeving, met een Python SDK voorgeïnstalleerd en andere data science en ML tools. Het gebruik van Azure Data Science VM geeft je meer schaalbaarheid in vergelijking met lokaal ontwikkelen. Onze ervaring is dat voor een integrale data science oplossing het gebruik van Azure Machine Learning, en het gebruik van een gewone Virtual Machine als cloud-based computing geïntegreerd met AML de voorkeur heeft. 

 

Data tools: de conclusie 

Concluderend kunnen we zeggen dat er altijd wel een tool te vinden is om je data science en analytics workload naar Azure te verplaatsen. Dit komt door de grote variëteit aan tools waaruit we in Azure kunnen kiezen, het gemak waarmee ze kunnen worden ingesteld en onderhouden, en de hoge veiligheidskenmerken.

 

Hoe Intercept de overstap naar Azure aanpakt    

Volgens de DLM-aanpak pakt Intercept jouw Data Science project stap voor stap aan. Samen met onze Data Scientist begeleiden we u door je business requirements en vertalen deze naar een Data Design. Dit Data Design vormt de blauwdruk voor je Data Science project. Plan een afspraak met ons om vast te stellen welke uitdagingen je wilt oplossen met Data Science.