202511101440 Status: school Tags: Datascience
avans 2-2 datascience 2025-11-10
weet in welke assesment groep je zit. ik zie hier dat ik nog niet in een DUO groep zit.
de rubric van het assesment staat online. kijk naar je rubric of dat het klopt als je je portfolio / verslag maakt.
kijk naar de rubric voor je bij het assesment komt. probeer het verhaal kant en klaar te hebben, je wordt beoordeeld op hetgene wat je verteld.
als je feedback wilt, stuur de leraar n bericht, of vraag het in de les.
de dimensionality reduction opdracht is een vraag die hij zou stellen op het assesment
gekke announcement
volgende week staat er UX ontwerp feedback ophalen in het rooster. Dit wil je doen omdat in de toetsing van LU3 staat dat het getoetst moet worden, hier zou je dat kunnen doen, want anders moet je een andere manier vinden om dat te doen.
building and evaluation
je wilt kijken of dat je onzin terugkrijgt van je AI. je wilt kijken of de resultaten gelijk lopen met wat je verwacht. kijken hoe precies de AI is.
supervised en unsupervised learning, supervised learning is een model trainen door te labellen waar je dataset over gaat. unsupervised is zonder label, je weet niet waar de dataset over gaat.
a baseline is de ondergrens van hoe goed je AI moet zijn. dit kan je doen met een pre-trained is. voorbeelden van baselines
het is geen plagiaat om iemands anders techniek te googlen opo een soortgelijk project, en dat gwn na te doen / te implementeren op jouw dataset. zolang je het maar uit kan leggen.
machine learning is een machine die zichzelf leert. voor voorspellingen etc.
reinforced learning is een rewards systeem om ai te trainen. het is dan een agent genoemd ipv een model.
AB testen van chatgpt is ook reinforcement learning.
clustering kan je dingen laten classificeren in een unsipervised learning scenario.
linear regression is a supervised learning methode, omdat je met bekende labels werkt. je vergelijkt je prediction met de echte values.
hij kijkt in multiple attampts welk resultaat het meest accuraat is, en daarvan gaat ie verder. dat is linear regression. hier is een slide van met een plaatje. je probeert de root mean squared error zo klein mogelijk te maken.
als je dit gaat trainen ga je de visualisaties zelf niet zien.
om met de mean squared error te kijken of dat het goed genoeg is. k-means is a unsupervised learning method. de k staat voor het aantal clusters.
view slide.
je weet vantevoren niet hoeveel clusters er zijn.
hij gebruikt een centroid? om te kijken welkes items er bij het cluster hoort.
je kiest een aantal aan clusters. het aantal clusters moet je altijd zelf bepalen. een centroid wordt dan random neergezet.
je wilt een cluster maken om te zorgen dat de intensiteit sterk is.
net zoals de root mean squared error is er hier ook een calculatie om te zien of dat je goed zit.
bij clustering weet je niet wat de label is, het output cluster name is gwn een nummmer.
use cases:
- customer segmentation
- image compression
- document clustering
regression metrics
er zijn veel geskipte dingen of niet behandelde slides. waarschijnlijk omdat hij eerder naar huis wilt.
demo
hij heeft een korte demo yupiter notebook, die die wss gaat delen op brightspace.
References
dit zijn de notes over de les van vandaag
- De vorige les