Skip to main content
Medarbejderportal

Udlevering af data til studerende



Udlevering af data til studerende kræver, at data skal være anonymiseret og nedenstående grundregler følges.



Datasæt, som udleveres:

  1. må ikke have en krypterings-/kodenøgle, der kan gøre data personhenførbare

  2. skal indeholde minimum 3 individer med samme variabelværdi i samtlige variable (for data på individniveau); skal indeholde mindst 3 observationer i alle celler for alle kombinerede inkluderede variable (for aggregerede data)

  3. må kun bestå af de variable, som skal anvendes i de planlagte analyser.

Kravet om, at minimum 3 individer skal have samme variabelværdier i samtlige variable, betyder, at vi sandsynligvis bliver nødt til at modificere de fleste datasæt, inden de sendes til studerende. I praksis skal vi identificere de kombinationer af variabelværdier, som forekommer 2 eller færre gange. Disse skal da enten fjernes fra datasættet eller duplikeres, så antallet af ’kopier’ er mindst 3. Hvorledes dette teknisk kan gøres i SAS og STATA, er der udarbejdet en instruktion (Kontrol af anonymitet) til her.



For at sikre mindst muligt behov for modifikation af datasættet anbefales det:

  1. at antallet af variable, som udleveres til den studerende, holdes så lavt som overhovedet muligt i forhold til det stillede forskningsspørgsmål.

  2. at kontinuerte variable kategoriseres. Er det i forhold til det stillede forskningsspørgsmål ikke muligt at anvende kategoriserede variable, vil det sandsynligvis være nødvendigt at modificere dele af de kontinuerte observationer, inden datasættet udleveres til den studerende.

Skulle der være nogle studerende (bachelor som speciale), som efterfølgende planlægger at sammenskrive deres opgave til en videnskabelig artikel, vil de naturligvis skulle genkøre deres analyser på det ikke-modificerede datasæt. Når de gør dette, vil de nødvendigvis skulle sidde på SIF.



Sidst opdateret: 28.10.2022