« Back to Glossary Index

OCR steht für Optical Character Recognition (zu Deutsch: optische Zeichenerkennung). In der IT ist es eine Technologie, die es ermöglicht, Texte aus Bildern (wie Fotos oder Scans) in digitalen, bearbeitbaren und durchsuchbaren Text umzuwandeln.

Die Funktionsweise im Überblick

Computer “sehen” Bilder nur als eine Ansammlung farbiger Bildpunkte (Pixel). Ohne OCR weiß ein PC nicht, dass die schwarzen Punkte auf einem Scan das Wort „Rechnung“ bilden. Der OCR-Prozess läuft meist in diesen Schritten ab:

  1. Bildanalyse: Die Software erkennt das Layout und identifiziert Textbereiche.
  2. Zeichenerkennung: Mithilfe von Musterabgleich oder Merkmalextraktion vergleicht das System Formen mit bekannten Buchstaben und Ziffern.
  3. Digitalisierung: Das Ergebnis wird in einen maschinencodierten Text (z.B. ASCII) übersetzt.

Warum ist OCR wichtig?

  • Durchsuchbarkeit: Eingescannte PDF-Dokumente können nach Stichworten durchsucht werden.
  • Bearbeitbarkeit: Man kann Text aus einem Papierdokument kopieren und in Programmen wie Word weiterverarbeiten, ohne ihn abtippen zu müssen.
  • Automatisierung: Unternehmen nutzen OCR, um Rechnungsdaten oder Adressen auf Briefen automatisch auszulesen und direkt in Buchhaltungssysteme zu übertragen.
  • Barrierefreiheit: OCR ermöglicht es speziellen Lesegeräten, gedruckte Texte für blinde oder sehbehinderte Menschen vorzulesen.

Moderne Entwicklungen

Aktuelle Systeme nutzen verstärkt Künstliche Intelligenz (KI) und neuronale Netze, wodurch sie auch komplexe Handschriften und Dokumente in über 100 Sprachen mit extrem hoher Genauigkeit erkennen können. Bekannte Software-Beispiele sind ABBYY FineReader oder die Open-Source-Bibliothek Tesseract.

« Zurück zur Übersicht