waar ben je naar op zoek?

Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt

Gelakt, maar niet meer leesbaar? Het kan gelukkig ook anders.

Woolakken

Een reactie op het artikel ‘Zwartlakken maakt meer kapot dan je lief is’

In het artikel ā€˜Zwartlakken maakt meer kapot dan je lief isā€™ van iBestuur van 15 februari 2024, wordt onthuld dat laksoftware die gebruikt wordt bij ministeries de (machine)leesbaarheid van gepubliceerde stukken sterk verminderd. In een kwart van de gevallen is de tekst zelfs helemaal niet meer leesbaar voor systemen en kijk je in feite naar een afbeelding. Voor mensen zonder beperking is het nog te lezen, maar voor mensen met een visuele beperking is het niet toegankelijk. In deze blog reageert onze collega Desmin Dekker dat niet alle laksoftware deze beperking heeft en de oplossing dichterbij is dan het artikel doet vermoeden.

Digitale toegankelijkheid

ilionx hecht grote waarde aan digitale toegankelijkheid. In onze oplossingen houden wij actief rekening met verschillende gebruikersgroepen en verschillende gebruiksdoelen. Het is namelijk zonde als een met zorg geanonimiseerd document niet meer doorzoekbaar of vindbaar is, omdat de karakters niet meer worden herkend. Sterker nog, de wet vereist dat vrijgegeven documenten leesbaar zijn voor machines.

Daar wordt lang niet altijd aan voldaan. Uit onderzoek van het adviescollege Openbaarheid en Informatiehuishouding blijkt 75% van alle vrijgegeven stukken uit scans van tekst te bestaan. Er is dus nog veel terrein te winnen om te voorkomen dat waardevolle informatie verloren gaat. Voor de meeste ministeries heeft 30 tot 40 procent van de vrijgegeven documenten een slechte score, zie onderstaande afbeelding:

Woo leesbaarheid teksten

Bron: UVA en Acoi rapport
Noot: Hoe roder, hoe minder leesbaar. Donkerrood bevat geen machine leesbare tekst meer.

Woo hulptool

Met die vereiste in gedachten hebben wij onze Woo-oplossing zo ontwikkeld dat tekst die niet geanonimiseerd wordt, buiten invloed van het programma blijft. Deze tekst blijft in haar originele vorm beschikbaar, zodat de leesbaarheid ervan niet wordt aangetast. Dit doet de oplossing door bestanden van verschillende formaten (Word, PowerPoint, Excel, enzovoort) te converteren naar PDF in plaats van deze om te zetten naar een afbeelding. Het voordeel van PDFā€™s is dat het leesbare documenten blijven.

In het (geconverteerde) bestand gaat het AI-model op zoek naar gegevens die voorgedragen worden voor redactie. Bij het ā€˜Definitief lakkenā€™ worden enkel deze gegevens van de documentinhoud permanent verwijderd.
Omdat de oorspronkelijke tekst behouden blijft, blijven de gepubliceerde documenten ook bruikbaar voor zoekmachines en indexen. Dit verhoogt de effectiviteit van het anonimiseerwerk, aangezien ook andere belanghebbenden dan alleen de aanvrager de gepubliceerde documenten kunnen vinden en lezen.

Oplossing dichterbij dan je denkt

In het artikel wordt verwezen naar software die is ontwikkeld aan de Universiteit van Illinois, waarmee het ook mogelijk is rechtstreeks in de originele PDF te anonimiseren. Maar waarom helemaal naar Illinois gaan, als het ook dichterbij huis kan via ilionx!

Interesse in een vrijblijvende demonstratie? Laat het ons weten.

Link gekopieërd