Direct naar hoofdinhoud

Gelakt, maar niet meer leesbaar? Het kan gelukkig ook anders.

Woo Lakken
Filter: overheid
Filter: hyperautomation
delen

Een reactie op het artikel ‘Zwartlakken maakt meer kapot dan je lief is’

In het artikel ‘Zwartlakken maakt meer kapot dan je lief is’(Verwijst naar een externe website) van iBestuur(Verwijst naar een externe website) van 15 februari 2024, wordt onthuld dat laksoftware die gebruikt wordt bij ministeries de (machine)leesbaarheid van gepubliceerde stukken sterk verminderd. In een kwart van de gevallen is de tekst zelfs helemaal niet meer leesbaar voor systemen en kijk je in feite naar een afbeelding. Voor mensen zonder beperking is het nog te lezen, maar voor mensen met een visuele beperking is het niet toegankelijk. In deze blog reageert onze collega Desmin Dekker(Verwijst naar een externe website) dat niet alle laksoftware deze beperking heeft en de oplossing dichterbij is dan het artikel doet vermoeden.

Digitale toegankelijkheid

ilionx hecht grote waarde aan digitale toegankelijkheid. In onze oplossingen houden wij actief rekening met verschillende gebruikersgroepen en verschillende gebruiksdoelen. Het is namelijk zonde als een met zorg geanonimiseerd document niet meer doorzoekbaar of vindbaar is, omdat de karakters niet meer worden herkend. Sterker nog, de wet vereist dat vrijgegeven documenten leesbaar zijn voor machines.

Daar wordt lang niet altijd aan voldaan. Uit onderzoek van het adviescollege Openbaarheid en Informatiehuishouding blijkt 75% van alle vrijgegeven stukken uit scans van tekst te bestaan. Er is dus nog veel terrein te winnen om te voorkomen dat waardevolle informatie verloren gaat. Voor de meeste ministeries heeft 30 tot 40 procent van de vrijgegeven documenten een slechte score, zie onderstaande afbeelding:

Fairiscore woo-dossiers
Bron: UVA en Acoi rapport Noot: Hoe roder, hoe minder leesbaar. Donkerrood bevat geen machine leesbare tekst meer.

Woo hulptool

Met die vereiste in gedachten hebben wij onze Woo-oplossing zo ontwikkeld dat tekst die niet geanonimiseerd wordt, buiten invloed van het programma blijft. Deze tekst blijft in haar originele vorm beschikbaar, zodat de leesbaarheid ervan niet wordt aangetast. Dit doet de oplossing door bestanden van verschillende formaten (Word, PowerPoint, Excel, enzovoort) te converteren naar PDF in plaats van deze om te zetten naar een afbeelding. Het voordeel van PDF’s is dat het leesbare documenten blijven.

In het (geconverteerde) bestand gaat het AI-model op zoek naar gegevens die voorgedragen worden voor redactie. Bij het ‘Definitief lakken’ worden enkel deze gegevens van de documentinhoud permanent verwijderd.
Omdat de oorspronkelijke tekst behouden blijft, blijven de gepubliceerde documenten ook bruikbaar voor zoekmachines en indexen. Dit verhoogt de effectiviteit van het anonimiseerwerk, aangezien ook andere belanghebbenden dan alleen de aanvrager de gepubliceerde documenten kunnen vinden en lezen.

Oplossing dichterbij dan je denkt

In het artikel wordt verwezen naar software die is ontwikkeld aan de Universiteit van Illinois, waarmee het ook mogelijk is rechtstreeks in de originele PDF te anonimiseren. Maar waarom helemaal naar Illinois gaan, als het ook dichterbij huis kan via ilionx!

Interesse in een vrijblijvende demonstratie? Laat het ons weten.

Wil je meer weten over onze softwareoplossingen voor Woo?

Laat je gegevens achter en dan neem ik contact met je op.

Portretfoto Desmin Dekker
Desmin Dekker

Meer blogs over Woo

meer blogs in overheid en hyperautomation