Besser bekannt als “Texterken­nung” beschreibt der engli­sche Fach­be­griff den Vorgang der “opti­cal chra­rac­ter reco­gni­tion” (OCR), der etwa bei papier­haf­ten Rech­nun­gen oder einfa­chen PDF-Bele­gen genutzt wird, um die Daten maschi­nell zu extra­hie­ren. Mit der zuneh­men­den Verbrei­tung von struk­tu­rier­ten Daten­sät­zen in elek­tro­ni­schen Bele­gen fällt dieser (meist echt fehler­an­fäl­lige) Schritt des auto­ma­ti­schen “Ausle­sens” per OCR immer häufi­ger weg.