Skip to content

Latest commit

 

History

History
263 lines (186 loc) · 27.6 KB

File metadata and controls

263 lines (186 loc) · 27.6 KB

Datawetenschap voor Beginners - Een Curriculum

Open in GitHub Codespaces

GitHub license GitHub contributors GitHub issues GitHub pull-requests PRs Welcome

GitHub watchers GitHub forks GitHub stars

Microsoft Foundry Discord

Microsoft Foundry Developer Forum

Azure Cloud Advocates bij Microsoft bieden met plezier een 10-weken durend, 20-lessen curriculum aan dat volledig draait om Datawetenschap. Elke les bevat voorafgaande en latere quizzen, geschreven instructies om de les te voltooien, een oplossing, en een opdracht. Onze projectgerichte pedagogiek stelt je in staat om te leren terwijl je bouwt, een bewezen manier waarop nieuwe vaardigheden 'blijven hangen'.

Hartelijke dank aan onze auteurs: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison.

🙏 Speciale dank 🙏 aan onze Microsoft Student Ambassador auteurs, reviewers en inhoudbijdragers, in het bijzonder Aaryan Arora, Aditya Garg, Alondra Sanchez, Ankita Singh, Anupam Mishra, Arpita Das, ChhailBihari Dubey, Dibri Nsofor, Dishita Bhasin, Majd Safi, Max Blum, Miguel Correa, Mohamma Iftekher (Iftu) Ebne Jalal, Nawrin Tabassum, Raymond Wangsa Putra, Rohit Yadav, Samridhi Sharma, Sanya Sinha, Sheena Narula, Tauqeer Ahmad, Yogendrasingh Pawar , Vidushi Gupta, Jasleen Sondhi

Sketchnote by @sketchthedocs https://sketchthedocs.dev
Datawetenschap voor Beginners - Sketchnote door @nitya

🌐 Meertalige Ondersteuning

Ondersteund via GitHub Action (Automatisch & Altijd Up-to-Date)

Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Khmer | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese

Wenst u liever lokaal te klonen?

Deze repository bevat 50+ taalvertalingen die de downloadgrootte aanzienlijk vergroten. Om zonder vertalingen te klonen, gebruik sparse checkout:

Bash / macOS / Linux:

git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git
cd Data-Science-For-Beginners
git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'

CMD (Windows):

git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git
cd Data-Science-For-Beginners
git sparse-checkout set --no-cone "/*" "!translations" "!translated_images"

Dit geeft je alles wat je nodig hebt om de cursus te voltooien met een veel snellere download.

Als je extra vertalingen wenst, zijn ondersteunde talen hier te vinden hier

Word lid van onze Community

Microsoft Foundry Discord

We hebben een lopende Discord leer met AI-serie, leer meer en doe mee via Learn with AI Series van 18 - 30 september 2025. Je krijgt tips en trucs over het gebruik van GitHub Copilot voor Datawetenschap.

Learn with AI series

Ben jij een student?

Begin met de volgende bronnen:

  • Student Hub pagina Op deze pagina vind je beginnersbronnen, studentenpakketten en zelfs manieren om een gratis certificaatvoucher te krijgen. Dit is een pagina die je wilt bookmarken en van tijd tot tijd wilt controleren aangezien we de inhoud minstens maandelijks wisselen.
  • Microsoft Learn Student Ambassadors Word lid van een wereldwijde gemeenschap van studentambassadeurs, dit kan jouw toegang tot Microsoft zijn.

Aan de Slag

📚 Documentatie

👨‍🎓 Voor Studenten

Volledige Beginners: Nieuw met datawetenschap? Begin met onze beginnersvriendelijke voorbeelden! Deze eenvoudige, goed becommentarieerde voorbeelden helpen je de basis te begrijpen voordat je in het volledige curriculum duikt. Studenten: om dit curriculum zelfstandig te gebruiken, fork je de hele repo en maak je de oefeningen zelfstandig af, te beginnen met een pre-college quiz. Lees dan de college en voltooi de rest van de activiteiten. Probeer de projecten te creëren door de lessen te begrijpen in plaats van de oplossingcode te kopiëren; die code is echter beschikbaar in de /solutions mappen in elke projectgerichte les. Een ander idee is om een studiegroep te vormen met vrienden en samen door de inhoud te gaan. Voor verdere studie raden we Microsoft Learn aan.

Snelstart:

  1. Bekijk de Installatiehandleiding om je omgeving op te zetten
  2. Bekijk de Gebruiksaanwijzing om te leren hoe je met het curriculum werkt
  3. Begin met Les 1 en werk de lessen sequentieel door
  4. Word lid van onze Discord-community voor ondersteuning

👩‍🏫 Voor Docenten

Docenten: we hebben enkele suggesties toegevoegd over hoe u dit curriculum kunt gebruiken. We horen graag uw feedback in ons discussieforum!

Maak kennis met het team

Promo video

Gif door Mohit Jaisal

🎥 Klik op de afbeelding hierboven voor een video over het project en de mensen die het hebben gemaakt!

Pedagogiek

We hebben twee pedagogische uitgangspunten gekozen bij het opbouwen van dit curriculum: ervoor zorgen dat het projectgericht is en dat het frequente quizzen bevat. Aan het einde van deze serie hebben studenten de basisprincipes van data science geleerd, inclusief ethische concepten, gegevensvoorbereiding, verschillende manieren om met gegevens te werken, datavisualisatie, data-analyse, praktijkvoorbeelden van data science en meer.

Daarnaast zet een quiz met lage inzet vóór een les de intentie van de student om een onderwerp te leren, terwijl een tweede quiz na de les zorgt voor verdere behoud van kennis. Dit curriculum is ontworpen om flexibel en leuk te zijn en kan geheel of gedeeltelijk worden gevolgd. De projecten beginnen klein en worden aan het einde van de 10 weken-cyclus steeds complexer.

Vind onze Gedragscode, Bijdragen, Vertalingsrichtlijnen. We verwelkomen uw constructieve feedback!

Elke les bevat:

  • Optionele schetsnotitie
  • Optionele aanvullende video
  • Voor-les opwarmquiz
  • Geschreven les
  • Voor projectgebaseerde lessen, stapsgewijze handleidingen om het project te bouwen
  • Kenniscontroles
  • Een uitdaging
  • Aanvullende lectuur
  • Opdracht
  • Quiz na de les

Een notitie over quizzen: Alle quizzen bevinden zich in de Quiz-App map, voor in totaal 40 quizzen met elk drie vragen. Ze zijn gekoppeld vanuit de lessen, maar de quiz-app kan lokaal worden uitgevoerd of worden geïmplementeerd naar Azure; volg de instructies in de map quiz-app. Ze worden geleidelijk gelokaliseerd.

🎓 Voor beginners geschikte voorbeelden

Nieuw in Data Science? We hebben een speciale voorbeeldenmap gemaakt met eenvoudige, goed becommentarieerde code om je op weg te helpen:

  • 🌟 Hallo Wereld - Je eerste data science programma
  • 📂 Gegevens laden - Leer datasets lezen en verkennen
  • 📊 Eenvoudige analyse - Bereken statistieken en vind patronen
  • 📈 Basisvisualisatie - Maak grafieken en diagrammen
  • 🔬 Echte wereld project - Volledig workflow van begin tot eind

Elk voorbeeld bevat gedetailleerde opmerkingen die elke stap uitleggen, perfect voor absolute beginners!

👉 Begin met de voorbeelden 👈

Lessen

 Schetsnotitie door @sketchthedocs https://sketchthedocs.dev
Data Science Voor Beginners: Routekaart - Schetsnotitie door @nitya
Lesnummer Onderwerp Lessengroep Leerdoelen Gekoppelde les Auteur
01 Data Science definiëren Introductie Leer de basisconcepten achter data science en hoe het gerelateerd is aan kunstmatige intelligentie, machine learning en big data. les video Dmitry
02 Data Science ethiek Introductie Concepten, uitdagingen en kaders van data-ethiek. les Nitya
03 Data definiëren Introductie Hoe data wordt geclassificeerd en de veelvoorkomende bronnen ervan. les Jasmine
04 Introductie tot Statistiek & Kansrekening Introductie De wiskundige technieken van kansrekening en statistiek om data te begrijpen. les video Dmitry
05 Werken met relationele data Werken met Data Introductie tot relationele data en de basis van het verkennen en analyseren van relationele data met de Structured Query Language, ook wel SQL genoemd (uitgesproken als "see-quell"). les Christopher
06 Werken met NoSQL data Werken met Data Introductie tot niet-relationele data, de verschillende types en de basis van het verkennen en analyseren van documentendatabases. les Jasmine
07 Werken met Python Werken met Data Basis van Python gebruiken voor data-exploratie met bibliotheken zoals Pandas. Basiskennis van Python programmeren wordt aanbevolen. les video Dmitry
08 Gegevensvoorbereiding Werken met Data Onderwerpen over technieken voor het schoonmaken en transformeren van data om uitdagingen aan te pakken zoals ontbrekende, onnauwkeurige of onvolledige data. les Jasmine
09 Visualiseren van hoeveelheden Datavisualisatie Leer hoe je Matplotlib gebruikt om vogeldatagegevens te visualiseren 🦆 les Jen
10 Visualiseren van verdelingen van data Datavisualisatie Visualiseren van observaties en trends binnen een interval. les Jen
11 Visualiseren van verhoudingen Datavisualisatie Visualiseren van discrete en gegroepeerde percentages. les Jen
12 Visualiseren van relaties Datavisualisatie Visualiseren van verbanden en correlaties tussen datasets en hun variabelen. les Jen
13 Betekenisvolle visualisaties Datavisualisatie Technieken en richtlijnen om je visualisaties waardevol te maken voor effectieve probleemoplossing en inzichten. les Jen
14 Introductie tot de data science levenscyclus Levenscyclus Introductie tot de data science levenscyclus en de eerste stap van het verkrijgen en extraheren van data. les Jasmine
15 Analyseren Levenscyclus Deze fase van de data science levenscyclus richt zich op technieken om data te analyseren. les Jasmine
16 Communicatie Levenscyclus Deze fase van de data science levenscyclus richt zich op het presenteren van inzichten uit de data op een manier die het voor beslissers makkelijker maakt om te begrijpen. les Jalen
17 Data Science in de cloud Cloud Data Deze reeks lessen introduceert data science in de cloud en de voordelen ervan. les Tiffany en Maud
18 Data Science in de cloud Cloud Data Modellen trainen met Low Code tools. les Tiffany en Maud
19 Data Science in de cloud Cloud Data Modellen implementeren met Azure Machine Learning Studio. les Tiffany en Maud
20 Data Science in het wild In the Wild Data science gedreven projecten in de echte wereld. les Nitya

GitHub Codespaces

Volg deze stappen om dit voorbeeld te openen in een Codespace:

  1. Klik op het Code dropdown-menu en selecteer de optie Openen met Codespaces.
  2. Selecteer + Nieuwe codespace onderaan het paneel. Voor meer info, kijk in de GitHub documentatie.

VSCode Remote - Containers

Volg deze stappen om deze repo in een container te openen met je lokale machine en VSCode met de VS Code Remote - Containers extensie:

  1. Als dit je eerste keer is dat je een ontwikkelcontainer gebruikt, zorg dan dat je systeem voldoet aan de vereisten (bijv. Docker geïnstalleerd) in de startgids.

Om deze repository te gebruiken, kun je de repository openen in een geïsoleerde Docker volume:

Opmerking: Onder de motorkap gebruikt dit de Remote-Containers: Clone Repository in Container Volume... opdracht om de broncode in een Docker volume te klonen in plaats van in het lokale bestandssysteem. Volumes zijn de geprefereerde methode om containerdata persistent te bewaren.

Of open een lokaal gekloonde of gedownloade versie van de repository:

  • Clone deze repository naar je lokale bestandssysteem.
  • Druk op F1 en selecteer de opdracht Remote-Containers: Open Folder in Container....
  • Selecteer de gekloonde kopie van deze map, wacht tot de container start, en probeer het uit.

Offline toegang

Je kunt deze documentatie offline draaien met behulp van Docsify. Fork deze repo, installeer Docsify op je lokale machine, en typ dan in de hoofdmap van deze repo docsify serve. De website zal dan op poort 3000 op je localhost worden geserveerd: localhost:3000.

Let op, notebooks worden niet gerenderd via Docsify, dus wanneer je een notebook moet uitvoeren, doe dat dan apart in VS Code met een Python kernel.

Andere curriculum

Ons team produceert ook andere curricula! Bekijk:

LangChain

LangChain4j for Beginners LangChain.js voor Beginners LangChain voor Beginners

Azure / Edge / MCP / Agents

AZD voor Beginners Edge AI voor Beginners MCP voor Beginners AI Agents voor Beginners


Generatieve AI Reeks

Generatieve AI voor Beginners Generatieve AI (.NET) Generatieve AI (Java) Generatieve AI (JavaScript)


Kernleren

ML voor Beginners Datawetenschap voor Beginners AI voor Beginners Cybersecurity voor Beginners Webontwikkeling voor Beginners IoT voor Beginners XR Ontwikkeling voor Beginners


Copilot Reeks

Copilot voor AI Paired Programming Copilot voor C#/.NET Copilot Avontuur

Hulp Krijgen

Problemen ondervonden? Bekijk onze Probleemoplossingsgids voor oplossingen voor veelvoorkomende problemen.

Als je vastloopt of vragen hebt over het bouwen van AI-apps. Doe mee met mede-leerlingen en ervaren ontwikkelaars in discussies over MCP. Het is een ondersteunende gemeenschap waar vragen welkom zijn en kennis vrij wordt gedeeld.

Microsoft Foundry Discord

Als je productfeedback of fouten hebt tijdens het bouwen, bezoek dan:

Microsoft Foundry Developer Forum


Disclaimer:
Dit document is vertaald met behulp van de AI-vertalingsdienst Co-op Translator. Hoewel we streven naar nauwkeurigheid, dient u er rekening mee te houden dat geautomatiseerde vertalingen fouten of onjuistheden kunnen bevatten. Het originele document in de oorspronkelijke taal moet als de gezaghebbende bron worden beschouwd. Voor cruciale informatie wordt professionele menselijke vertaling aanbevolen. Wij zijn niet aansprakelijk voor eventuele misverstanden of verkeerde interpretaties die voortvloeien uit het gebruik van deze vertaling.