202511171347 Status: school Tags: Datascience
avans 2-2 datascience teacher-notes
Hoi Everyone,
Ter ondersteuning bij jullie Smart Study Coach-project wil ik een aantal open-source projecten met jullie delen.
Deze kunnen dienen als baseline of inspiratie voor jullie eigen oplossing.
Belangrijk: het gaat niet om het specifieke domein (Coursera, universiteit X, enz.), maar om de aanpak van een recommender system:
(Natuurlijk staan jullie volledig vrij om ook andere bronnen of voorbeelden te gebruiken als die beter passen bij jullie idee of interesse, )
hoe je van data → profiel → model → aanbevelingen komt.
Het idee is dat je niet alles zelf hoeft te programmeren, maar dat je leert begrijpen:
-hoe de onderdelen samenwerken (data, features, model, evaluatie);
-hoe je bestaande code kunt aanpassen aan onze dataset en aan de rubric.
Course-Recommendation-System (Ganesh2409)
Waarom relevant
- Bouwt een aanbevelingssysteem op basis van cursusbeschrijvingen met TF-IDF + cosine similarity. GitHub+1
- Lijkt sterk op onze smart study coach, maar dan met Coursera-data.
Aansluiting bij de rubric
- Business Understanding: duidelijk probleem en doel (studenten helpen kiezen).
- EDA & Dataverwerking: tekstverwerking en datasetvoorbereiding.
- Model Training & Evaluation: werkend content-based model.
- Optimization & Tuning: ruimte om met parameters te spelen (bijv. n-grams, aantal aanbevelingen).
Perfect als baseline: vooral de dataset en de profielinput hoef je aan te passen.
PathPilot-recommendation-system
Waarom relevant
- Richt zich op studentenprofielen en leerpaden.
- Combineert voorkeuren, planning en historische data in de aanbevelingen. GitHub
Aansluiting bij de rubric
- Business Understanding: duidelijke context van studieplanning.
- EDA & Model: voorbeeld van een hybride benadering (inhoud + voorkeuren/gedrag).
Interessant voor wie verder wil gaan dan alleen content-based recommendations.
CourseConnect
Waarom relevant
- Een volledige web-app (frontend + backend) met recommendation-logica. GitHub
Aansluiting bij de rubric
- Business Understanding: duidelijke productcontext (gebruikersflow).
- EDA & Model: preprocessing + meerdere modellen mogelijk.
- Optimization & Tuning: je kunt hier goed oefenen met varianten en hyperparameters.
Geschikt voor voor de presnttaie want heeft  iets met webapplicaties en UX.
SmartCourse-Contextual-Advising
Waarom relevant
- Onderzoeksproject met een contextuele advisor op basis van transcript + studiepad. GitHub+2arXiv+2
Aansluiting bij de rubric
- Business Understanding: diepgaande context en aandacht voor ethiek en risico’s.
- EDA & Model: uitgebreide analyse en rijke datavoorbereiding.
- Optimization & Evaluation: meerdere evaluatiemetrics en onderzoeksopzet.
Vooral geschikt voor wie verdieping zoekt of een meer research-achtige benadering wil.
Doel van deze voorbeelden
Je hoeft het wiel niet opnieuw uit te vinden.
Gebruik een bestaand project om te leren hoe een recommender system werkt, en pas het vervolgens aan:
- aan jullie dataset (VKM’s)
- aan de rubric (business context, EDA, modelkeuze, evaluatie, ethiek)
‼️Belangrijk is dat je de stappen zelf begrijpt en kunt onderbouwen:
probleem → data → model → evaluatie → ethiek & risico’s.‼️
Volgende stap
Neem de tijd om zelf te onderzoeken hoe de code werkt en hoe je die kunt aanpassen.
Juist door te experimenteren, fouten te maken en te verbeteren, ontwikkel je het beste inzicht in het proces.
Deze notebook (Smart_Job_Role_Advisor_Baseline.ipynb) demonstreert een volledig, uitlegbaar recommender system.
Het laat zien hoe je data verwerkt, tekst omzet in TF–IDF-vectoren, een profiel encodeert, een hybride score berekent en aanbevelingen genereert.
Ook worden constraints, populariteit, diversiteit en uitleg meegenomen.
Hoewel het voorbeeld over vacatures gaat, zijn de technieken heel goed  toepasbaar op jullie opdracht.
Gebruik dit notebook als inspiratie of baseline voor jullie eigen model.
References
Dit is een teams berichtje van de leraar over het avans 2-2 LU2 project.