18-03-2005
|
Op maandag 28 februari 2005 is gedurende de Landelijke Contactdag Document Management in het Stadstheater te Zoetermeer een scanrecordpoging ondernomen om 29.200 transparante volkstellingbladen uit 1947 te scannen. De Landelijke Contactdag werd door DisConsult en DIOR Opleidingen georganiseerd. De recordpoging is ondernomen door Van Buuren Documentaire Systemen. Binnenkort zal door middel van Optical Character Recognition (OCR) een deel van het materiaal in bruikbare tabellen worden omgezet. Hierbij wordt gebruik gemaakt van specialistische OCR software van de firma Top Image Systems (TIS).
Om de transparanten, die worden bewaard in het archief van het CBS te kunnen laten digitaliseren zijn bij deze recordpoging de volgende stappen ondernomen:
Materiaal selectie
Scanning
Herkenning van gegevens middels Optical Character Recognition (OCR)
|
Dozen met te scannen transparanten van de Volks- en Beroepstelling 1947.
|
|
De voorbereiding bestond uit het uitselecteren van de omslagmappen VBT 1947 uit de archiefdozen en deze apart in nieuwe archiefdozen onder te brengen. Het materiaal werd per map door het NIWI-KNAW voorzien van een voorloopblad waarop handmatig het oorspronkelijke doosnummer en mapvolgnummer werd aangegeven om na verwerking het materiaal weer terug te kunnen sorteren in de oorspronkelijke mappen. Tevens konden hierdoor de plaatsnamen na scanning per scheiding door middel van Data Entry aangegeven worden.
Vanwege de kwetsbaarheid van het materiaal is op de Landelijke Contactdag Document Managent de helft van de transparanten door de firma Van Buuren gescand. Inmiddels zijn alle transparanten als images gescand. Leon van Oosterom heeft tijdens de recordpoging achtergrond informatie over de firma Van Buuren en haar voorbereidingen op de recordpoging gepresenteerd
De opzet was om na scanning de images te laten herkennen door vooraf door de firma Top Image Systems (TIS) samengestelde templates. Vanwege de zeer korte voorbereidingstijd is dit deel van de digitalisatie op de Landelijke Contactdag Document Managent niet uitgevoerd. Binnenkort zal TIS alsnog met resultaten komen, het gaat hier om de gegevens van tabel 12 (Beroepsbevolking naar bedrijfsklassen en plaats in het huishouden). Tabel 12 zal digitaal in de vorm van Excel tabellen beschikbaar komen. Voor de andere bladen zal de herkenning zich beperken tot de tabelnummers, zodat eventueel in een later stadium per tabelsoort een gelijkwaardige actie ondernomen kan worden.
De door Van Buuren gescande images zijn beschikbaar via de bladerfunctie binnen deze website. Ze zijn gegroepeerd per provincie en daaronder per gemeente.
|
VBT 1947. Tabel 12. Holten: 'Beroepsbevolking naar bedrijfsklassen en plaats in het huishouden'.
|