Project Description

Projektstudie:

Tabellenextraktion für eine Regierungsbehörde

Regierungsbehörde
~95.000 Mitarbeiter*innen

~95 %

Genauigkeit

IDA Extraction

IDA Textlayer
IDA Klassifikation
IDA Extraktion

Ausgangssituation:

Gemeinsam mit IBM als Integrator stellte sich PLANET AI der Herausforderung, einer Regierungsbehörde eine automatisierte Lösung zur Datenextraktion bereitzustellen. Der Kunde kämpfte mit der Verarbeitung einer steigenden Menge an Formularen aufgrund der COVID-19-Pandemie. Diese Formulare werden als gescannte PDFs verarbeitet und enthalten neben teils schwer lesbarer Handschrift auch Tabellen. Da die Dokumente streng vertraulich sind, erhielt PLANET AI im Vorfeld keine authentischen Daten.

PLANET AI’s Lösung:

PLANET AI stellte der Behörde drei Features der IDA Suite zur Verfügung:

  • Das Textlayer-Feature dient als Ausgangspunkt für die weitere Verarbeitung, in dem es den gescannten Inhalt les- und durchsuchbar macht.
  • Darauf aufbauend benötigt die IDA Klassifikation nur eine geringe Menge an Trainingsdaten, um ganze Dokumente oder einzelne Seiten zu klassifizieren, was die Sortierung der Formulare reformierte.
  • Zusätzlich ermöglicht die IDA Extraktion das Auslesen spezifischer Key-Value-Gruppen, wie Namen, Adressen und andere relevante Werte – aufbauend auf der vorangegangenen Dokumentenklassifikat