Übersetzungen dieser Seite:

OCR für Linux

Linux Magazin 07/2010:
Die ABBYY-OCR-Engine für Linux im Test - Richtig gelesen?

Warum Texterkennung unter Linux?

  • Ein hoher Anteil geschäftskritischer Anwendungen wird unter Linux aufgeführt, z. B. Web-, E-Mail-, Datei- und Datenbankserver. Die meisten dieser Systeme zählen zur grundlegenden IT-Infrastruktur von Unternehmen.
  • Heutzutage gibt es kaum jemanden, der nicht privat und beruflich in irgendeiner Form mit digitalen Dokumenten in Berührung kommt. Aber auch gedruckte Dokumente sind noch nicht von der Bildfläche verschwunden und enthalten große Mengen wichtiger Daten und Informationen, die zur digitalen Weiterverarbeitung extrahiert werden müssen.
  • Der Schlüssel, um Informationen in gescannten Papierdokumenten elektronsich zugänglich zu machen und in digitale Arbeitsabläufe zu integrieren, ist optische Zeichenerkennung oder kurz „OCR“ (Optical Character Recognition). OCR ermöglicht es, Scans schnell in durchsuchbare und bearbeitbare Dokumente oder plattformunabhängige PDF-Dateien umzuwandeln.
  • Da die optische Texterkennung und Konvertierung nur einmal im Lebenszyklus eines Dokuments durchgeführt wird, ist die Qualität der Erkennung und Konvertierung von entscheidender Bedeutung. Die OCR-Technologie von ABBYY zeichnet sich durch erwiesene Leistungsfähigkeit, zuverlässige Ergebnisse und ein hohes Produktivitätssteigerungspotential aus.

Was ist ABBYY FineReader Engine 8.0 CLI für Linux?

  • ABBYY FineReader Engine 8.0 CLI für Linux ist eine Command Line basierende Anwendung (ohne Benutzeroberfläche), die auf ABBYYs hochentwickelter OCR-Technologie (Optical Character Recognition) basiert.
  • Die Anwendung automatisiert OCR- und Konvertierungsvorgänge von Dokumenten auf Linux-Systemen.
  • Die Verarbeitung wird vollständig über die Befehlszeile gesteuert.
  • ABBYY OCR für Linux bietet dieselbe hohe OCR-Qualität, die auch unter Windows erreicht wird.
  • Es werden zahlreiche Ausgabeformate unterstützt, z. B.: Text, RTF, HTML und PDF.
    Neu seit Mai 2010: XML Export jetzt inclusiv!
  • Wenn anspruchsvollere Verarbeitungsabläufe und eine höhere Integration realisiert werden sollen, können sich Entwickler die ABBYY OCR SDKs (Software Development Kits) nutzen. FineReader Engine 8.0 CLI für Linux basiert auf ABBYY FineReader Engine 8.0 SDK mit erweiterter Plattform-Unterstützung.

Warum OCR-Technologie von ABBYY einsetzen?

  • ABBYY verfügt über modernste Dokumenterkennungs- und PDF-Konvertierungsverfahren.
  • Profitieren Sie von der herausragenden Genauigkeit, die von zahlreichen Kunden und Brancheninsidern auf der ganzen Welt anerkannt wird.
  • Die OCR-Technologie von ABBYY ist für Linux und viele andere Plattformen verfügbar, z. B. Android, BSD, Linux, MacOS X, iPhone, Symbian, Windows, Windows Mobile…
  • ABBYY FineReader Engine 8.0 CLI für Linux unterstützt die Erkennung von Dokumenten, die mehrere Sprachen enthalten. Insgesamt können 190 Sprachen verarbeitet werden.

Ein Linux OCR Software Vergleich von splitbrain.org:

  • abbyyocr - cuneiform - gocr - ocrad - tesseract
  • www.splitbrain.org/blog/2010-06/15-linux_ocr_software_comparison (EN)(16.5.2010)