volkstelling 1960 11 miljoen geanonimiseerde inwoners op 11 miljoen ponskaarten 2000 ponskaarten per...

14
Volkstelling 1960 11 miljoen geanonimiseerde inwoners op 11 miljoen ponskaarten 2000 ponskaarten per doos, 5500 dozen Opgeslagen in twee lokaties Ingelezen in 1973, opgeslagen op tape Geïnventariseerd in 1982 Geanalyseerd en opgeschoond in 1994

Upload: sandra-declercq

Post on 14-Jun-2015

212 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Volkstelling 1960 11 miljoen geanonimiseerde inwoners op 11 miljoen ponskaarten 2000 ponskaarten per doos, 5500 dozen Opgeslagen in twee lokaties Ingelezen

Volkstelling 1960

• 11 miljoen geanonimiseerde inwoners op 11 miljoen ponskaarten

• 2000 ponskaarten per doos, 5500 dozen• Opgeslagen in twee lokaties• Ingelezen in 1973, opgeslagen op tape• Geïnventariseerd in 1982• Geanalyseerd en opgeschoond in 1994

Page 2: Volkstelling 1960 11 miljoen geanonimiseerde inwoners op 11 miljoen ponskaarten 2000 ponskaarten per doos, 5500 dozen Opgeslagen in twee lokaties Ingelezen

Volkstelling 1960Enige bevindingen

• +/- 300.000 records te weinig – 24 gemeenten in 4 provincies ontbreken – Ca. 30 gemeenten missen een substantieel

aantal mensen– Ca. 450 gemeenten missen slechts 1-10

mannen en/of vrouwen– maximaal 3000 records zijn te

reconstrueren uit verwijderde records• +/- 250.000 records te veel

– enkele gemeenten zijn (gedeeltelijk) dubbel ingelezen

Page 3: Volkstelling 1960 11 miljoen geanonimiseerde inwoners op 11 miljoen ponskaarten 2000 ponskaarten per doos, 5500 dozen Opgeslagen in twee lokaties Ingelezen

Volkstelling 1960

Wat ging er mis?• Sommige ponskaarten konden niet worden ingelezen

of zijn vernietigd tijdens het inlezen• Sommige dozen met ponskaarten zijn overgeslagen

andere zijn twee maal ingelezen• Sommige records bevatten foutieve waarden en zijn

geëlimineerd• Bestanden zijn (gedeeltelijk) overschreven door andere

• Tijdsdruk was hoog• Er is GEEN documentatie over het inlezen

Page 4: Volkstelling 1960 11 miljoen geanonimiseerde inwoners op 11 miljoen ponskaarten 2000 ponskaarten per doos, 5500 dozen Opgeslagen in twee lokaties Ingelezen

Volkstelling 1960

Voorbeeld van geëlimineerde records1115100421115 6302120001000995581111405057126086200 B"("N3=")"5ZD,10B 1760

1115100421110 1306363301000075-81111718035817732405 SC2+NSC3); 1770

1115100421116 1305352202000900521111205041728284204 ",/")"); 1780

1115100421119 4303430001000930521111203038829276500 B"("N3=")"5ZD,10B 1790

121586010 3855413012060 3 52701322981010 1060

12158W000 3755113010010 2 52801322981010 0061

121586001 3406713012050 00 0152701322981010 1860

< komt vaak overeen met 1 A komt vaak overeen met 1S komt vaak overeen met 2 V komt vaak overeen met 5W komt vaak overeen met 6 Z komt vaak overeen met 9

Page 5: Volkstelling 1960 11 miljoen geanonimiseerde inwoners op 11 miljoen ponskaarten 2000 ponskaarten per doos, 5500 dozen Opgeslagen in twee lokaties Ingelezen

Volkstelling 1960

Algemeen voorkomende problemen

• Enkele (hoeveel?) records raken zoek• Non-response• Tel-, reken- en drukfouten

Wat doet men met deze problemen?Is dit fundamenteel anders dan onze huidige problemen t.a.v.het bepalen van de waarde van deze dataset?

Page 6: Volkstelling 1960 11 miljoen geanonimiseerde inwoners op 11 miljoen ponskaarten 2000 ponskaarten per doos, 5500 dozen Opgeslagen in twee lokaties Ingelezen

Volkstelling 1960

Hoeveel moeite mag/wil men doen voor 4587 missende Rotterdamse mannen (0.62%)?

Page 7: Volkstelling 1960 11 miljoen geanonimiseerde inwoners op 11 miljoen ponskaarten 2000 ponskaarten per doos, 5500 dozen Opgeslagen in twee lokaties Ingelezen

Volkstelling 1960

Veel gemeenten, dus veel data-entry omwille van weinig personen. Hoe erg zijn 12 missende vrouwen in Serooskerke (Sch): 13,7%

Page 8: Volkstelling 1960 11 miljoen geanonimiseerde inwoners op 11 miljoen ponskaarten 2000 ponskaarten per doos, 5500 dozen Opgeslagen in twee lokaties Ingelezen

Volkstelling 1960

Voorstellen voor reconstructieGemeenten met ontbrekende records < 100 en < 1% Niets 100 - 1000 en 1% - 5% Weegfactoren > 1000 of > 5% Data-entry

Gemeenten met teveel records > 190% Halveren, daarna

behandelen als boven

<190 % Data-entry

Page 9: Volkstelling 1960 11 miljoen geanonimiseerde inwoners op 11 miljoen ponskaarten 2000 ponskaarten per doos, 5500 dozen Opgeslagen in twee lokaties Ingelezen

Volkstelling 1960

Publiceren

• Bij voorkeur op micro-niveau—remote execution

• Selectie van tabellen via StatLine en/of www.volkstelling.nl (Excel)

• Selectie van tabellen via HGIN

Page 10: Volkstelling 1960 11 miljoen geanonimiseerde inwoners op 11 miljoen ponskaarten 2000 ponskaarten per doos, 5500 dozen Opgeslagen in twee lokaties Ingelezen

Volkstelling 1960Spreiding van

Rooms-Katholieken

Page 11: Volkstelling 1960 11 miljoen geanonimiseerde inwoners op 11 miljoen ponskaarten 2000 ponskaarten per doos, 5500 dozen Opgeslagen in twee lokaties Ingelezen

Spreiding van Rooms-KatholiekenNederlands-HervormdenNiet kerkelijken

Page 12: Volkstelling 1960 11 miljoen geanonimiseerde inwoners op 11 miljoen ponskaarten 2000 ponskaarten per doos, 5500 dozen Opgeslagen in twee lokaties Ingelezen

Spreiding van

Humanisten

Page 13: Volkstelling 1960 11 miljoen geanonimiseerde inwoners op 11 miljoen ponskaarten 2000 ponskaarten per doos, 5500 dozen Opgeslagen in twee lokaties Ingelezen

Spreiding van

Leger des Heils

Page 14: Volkstelling 1960 11 miljoen geanonimiseerde inwoners op 11 miljoen ponskaarten 2000 ponskaarten per doos, 5500 dozen Opgeslagen in twee lokaties Ingelezen

Spreiding van

Vrijdenkers