Besser bekannt als “Texterkennung” beschreibt der englische Fachbegriff den Vorgang der “optical chraracter recognition” (OCR), der etwa bei papierhaften Rechnungen oder einfachen PDF-Belegen genutzt wird, um die Daten maschinell zu extrahieren. Mit der zunehmenden Verbreitung von strukturierten Datensätzen in elektronischen Belegen fällt dieser (meist echt fehleranfällige) Schritt des automatischen “Auslesens” per OCR immer häufiger weg.