Naar Synthetische data aanvragen

Synthetische data aanvragen

Onderzoek doen naar het onderwijssysteem en de onderwijsvolgers in Nederland? Vraag synthetische data aan.

Wat is synthetische data?

Met machine learning technieken maken we uit de registerdata van DUO data met kunstmatige leerlingen. Het eindproduct is een synthetische dataset. Alle individuen zijn fictief. De verdelingen en verbanden tussen variabelen blijven in dit proces behouden. U kunt dus dezelfde onderzoeksvragen beantwoorden die u met de registerdata ook zou kunnen beantwoorden.

Waar kunt u synthetische data voor gebruiken?
Synthetische data van DUO kunt u gebruiken voor statistisch onderzoek met data over de onderwijsvolgers binnen het Nederlandse systeem. Wij hebben data van leerlingen uit het primair onderwijs tot en met het hoger onderwijs. Het gaat onder meer om:
  • achtergrond kenmerken van de leerlingen; 
  • gegevens over leerprestaties; 
  • algemene persoonsgegevens en onderwijslocaties op alle niveaus;
  • eindtoetsscores in het PO;
  • profiel, richting en examengemiddeldes in het VO;
  • studies in het MBO en HO, enzovoort. 
De statistische verbanden uit de echte data bootsen we zo goed mogelijk na in de synthetische data. Afhankelijk van toegepaste methodes kunnen gevonden effecten wel afwijken. Daarom bieden wij aan de resultaten op de echte data te verifiëren. Hierdoor loopt u geen risico op invalide onderzoeksresultaten.
Zijn er beperkingen?

Afhankelijk van het onderzoek kunnen er beperkingen aan de synthetische dataset zijn. Het is niet voor elke onderzoeksvraag mogelijk een synthetische dataset aan te vragen. Zo komen exacte aantallen niet overeen tussen de echte en de synthetische data: een studie wiskunde heeft bijvoorbeeld 40% vrouwelijke studenten in werkelijkheid en 41% in de synthetische data

Hoe vraagt u synthetische data aan?

Heeft u een onderzoeksvraag die mogelijk aansluit bij de onderwijsdata van DUO? Neem contact met ons op via een e-mail naar informatieproducten@duo.nl

  • Op synthetische data is een leveringsovereenkomst van toepassing. Bekijk het voorbeeld (180Kb, pdf).
  • We rekenen geen kosten bij het leveren van synthetische data. 

Bent u niet zeker over de (onderzoek)vraag of van de relevantie? We denken graag met u mee! 

Heeft u vragen of wilt u meer informatie, neem dan ook contact met ons op.