IID S.A. is a platinum sponsor at EuroMed 2016. Read more...
ABBYY Fine Reader
ABBYY FlexiCapture Engine
ABBYY FlexiCapture
ABBYY FineReader Engine

Πλαίσιο Αναζήτησης

ABBYY FineReader Engine 11

Το ABBYY FineReader Engine 11 για λειτουργικά συστήματα Windows αποτελεί ένα εξελιγμένο εργαλείο ανάπτυξης λογισμικού (SDK - Software Development Kit), για την ενσωμάτωση των πολυγλωσσικών τεχνολογιών της ABBYY για OCR (αναγνώριση μηχανογραφημένων χαρακτήρων), ICR (αναγνώριση χειρόγραφων χαρακτήρων) OBR (αναγνώριση barcode), OMR (αναγνώριση Checkmark) και μετατροπή εγγράφων  σε εξωτερικές εφαρμογές.Το ABBYY FineReader Engine περιλαμβάνει όλες τις βασικές τεχνολογίες που απαιτούνται για την ανάπτυξη συστημάτων τελευταίας τεχνολογίας για «έξυπνη» αναγνώριση ή μετατροπή εγγράφων και συλλογή δεδομένων:

  • Υψηλής ποιότητας αναγνώριση (OCR/ICR/OBR/OMR)
  • Υποστήριξη 202 γλωσσών για OCR και 136 για ΙCR εκ των οποίων οι 52 με υποστήριξη λεξικών
  • Τεχνολογία Adaptive Document Recognition (ADRT), η οποία επεξεργάζεται όλες τις σελίδες ενός εγγράφου ως μία λογική μονάδα ώστε να διασφαλιστεί η ομοιογένεια και ενοποιημένη μορφή των αρχείων εξόδου
  • Υποστηρίζεται εξαγωγή πολλών τύπων αρχείων όπως:
    • Rich Text Format (RTF)
    • Microsoft Office 2007 (DOCX, XLSX και PPTX)
    • PDF, PDF/A (MRC συμπίεση για PDF και PDF/A)
    • Comma Separated Values (CSV)
    • HTML. Το FineReader Engine υποστηρίζει διάφορα code pages (Windows, DOS, Mac, ISO) και Unicode (UTF-8) κωδικοποίηση
    • Απλό κείμενο (TXT). Το FineReader Engine υποστηρίζει διάφορα code pages (Windows, DOS, Mac, ISO) και Unicode (UTF-16, UTF-8) κωδικοποίηση
    • ODT
    • ALTO
    • FB2
    • EPUB
    • vCard
    • XML — περιλαμβάνει το αναγνωρισμένο κείμενο, με επιπλέον πληροφορίες για την δομή του, χαρακτηριστικά της αναγνώρισης κλπ.
  • Υποστηρίζεται το πρότυπο COM και μπορεί να χρησιμοποιηθεί σε Microsoft Visual Studio.NET (VB.NET, C#), Microsoft Visual Basic 5.0, 6.0, Microsoft Visual C++ 4.x και νεότερες εκδόσεις, VB Script, και άλλες scripting languages, Borland Delphi 2.0, Java και νεότερες εκδόσεις, κάθε προγραμματιστικό περιβάλλον που υποστηρίζει το πρότυπο COM και ActiveX objects.
  • Το ABBYY FineReader Engine 11 προσφέρει ισχυρά εργαλεία προ-επεξεργασίας και μετεπεξεργασίας εικόνας, αναγνώριση μεγάλου όγκου δεδομένων, ανάλυση διάταξης εγγράφου και προηγμένη μετατροπή αρχείου PDF και συμπίεση με υποστήριξη διαφόρων τύπων PDF, όπως PDF/A και PDF με συμπίεση βάσει του προτύπου MRC (Mixed Raster Content). Αυτό παρέχει στον προγραμματιστή μεγάλη ελευθερία, όσον αφορά στην αρχειοθέτηση και την μετατροπή εγγράφων σε αναζητήσιμη και επεξεργάσιμη μορφή.

Τα στάδια αναγνώρισης και μετατροπής εγγράφων με χρήση του ABBYY FineReader Engine 11 είναι τα κάτωθι: 

Όσον αφορά την εισαγωγή των εγγράφων προς επεξεργασία υπάρχουν οι εξής δυνατότητες:

  • Από δίσκο ή την μνήμη
  • Μέσω σάρωσης με χρήση TWAIN
  • Με ασύγχρονη σάρωση και επεξεργασία OCR
  • Από ψηφιακές φωτογραφικές μηχανές

Προσφέρονται πολλές δυνατότητες για την βελτίωση/προετοιμασία των εικόνων των εγγράφων για την βελτιστοποίηση των αποτελεσμάτων της αναγνώρισης:

  • Ρουτίνες καθαρισμού για απομάκρυνση θορύβου κλπ.
  • Βελτιστοποίση εικόνων που έχουν προκύψει από φωτογράφιση (πχ. ευθυγράμμιση καμπυλωμένου κειμένου)
  • scaling,
  • αποκοπή (clipping),
  • περιστροφή
  • lines straightening,
  • κατοπτρισμός και αντιστροφή
  • αυτόματο deskewing
  • αυτόματο cropping
  • αυτόματος διαχωρισμός  διπλών σελίδων
  • διάφοροι αλγόριθμοι για την διόρθωση κλίσης ως 20 μοιρών
  • προσαρμοστική διαδικοποίηση (adaptive binarization – δυναμική μετατροπή εικόνας σε ασπρόμαυρη) & texture filtering

Μετά την ολοκλήρωση της προεπεξεργασίας πρέπει να οριστούν οι περιοχές αναγνώρισης. Υπάρχει η δυνατότητα ορισμού διαφορετικών μεθόδων για αυτόματη ανάλυση εγγράφων (Document Analysis – DA) βασισμένες σε αλγόριθμοπυς τεχνητής νοημοσύνης:

  • Full text DA: Αναγνωρίζει ολόκληρο το κείμενο συμπεριλαμβανομένου κειμένου που είναι ενσωματομένο σε εικόνες, πίνακες, διαγράμματα κλπ.  
  • DA with layout retention: εντοπίζει αυτόματα blocks, πίνακες, barcodes και εικόνες
  • Invoice pre-processing DA: Επικεντρώνει σε αριθμούς και πίνακες
  • Αυτόματη δημιουργία blocks: Χρησιμοποιείται κυρίως σε σενάρια αναγνώρισης σε επίπεδο πεδίων και ζωνών

Αφού έχουν οριστεί οι περιοχές αναγνώρισης εκτελείται η αναγνώριση χαρακτήρων και λέξεων. To SDK υποστηρίζει αναγνώριση 202 γλωσσών για OCR και 136 για ICR και έχει ενσωματωμένη μηχανή omnifont OCR (αναγνώριση ανεξαρτήτως γραμματοσειράς), οπότε έχει τη δυνατότητα αναγνώρισης μεγάλου εύρους τύπων κειμένου και αντικειμένων:

  • Standard γραμματοσειρές που χρησιμοποιούνται σε επιχειρησιακά περιβάλλοντα, περιοδικά, εφημερίδες
  • Έγγραφα εκτυπωμένα με dot-matrix εκτυπωτές, από γραφομηχανές ή εκτυπωτές αποδείξεων
  • Ειδικές γραμματοσειρές όπως OCR-A, OCR-B, MICR (E13B) & CMC7
  • Παλιές γραμματοσειρές όπως Fraktur & Schwabacher
  • Χειρόγραφοι χαρακτήρες (ICR) εντός διαφόρων πλαισίων
  • Checkmarks
  • 1D & 2D Barcodes

Ο προγραμματιστής έχει άμεση πρόσβαση στα αποτελέσματα της αναγνώρισης. Το λογισμικό Finereader Engine 11 παρέχει βασικές  πληροφορίες όπως οι συντεταγμένες των χαρακτήρων αλλά και σύνθετα χαρακτηριστικά όπως:

  • Πληροφορίες γραμματοσειρών και μορφοποίησης
  • Υποθέσεις αναγνώρισης λέξεων και χαρακτήρων

Οι πληροφορίες είναι διαθέσιμες μέσω  API, XML Export, ώστε να μπορεί να οριστεί αυτοματοποιημένη διόρθωση.Για απλοποιημένη επιβεβαίωση/διόρθωση παρέχονται γραφικές διεπαφές χρήστη (Visual Components - ActiveX controls). Τα αποτελέσματα της ανάλυσης της διάταξης των εγγράφων, της σειράς των σελίδων σε ένα έγγραφο και οι αβέβαια αναγνωρισμένοι χαρακτήρες είναι δυνατόν να τροποποιηθούνΠαρέχονται οι εξής γραφικές διεπαφές:

  • Scan Interface
  • Document Viewer
  • Image Viewer
  • Text Editor
  • Text Validator

Το FineReader Engine 11 περιλαμβάνει νέο βελτιωμένο API διαχείρισης γραμματοσειρών το οποίο παρέχει εκτεταμένη πρόσβαση σε αυτές κατά την διάρκεια της σύνθεσης.
To SDK παρέχει πολλαπλές δυνατότητες εξαγωγής σε διαφορετικούς τύπους αρχείων:

  • TXT, CSV
  • HTML, RTF, ODT, DOCX, XLS(X) and PPTX
  • Αρχεία E-book  – EPUB (.epub) & FictionBook (.FB2)
  • ABBYY XML – διαφορετικά επίπεδα διάταξης, παραγράφων και μορφοποίησης
  • ALTO XML
  • vCard για επαγγελματικές κάρτες
  • PDF

  • Για την ανάπτυξη εφαρμογών με χρήση του ABBYY FineReader Engine 11 απαιτείται η προμήθεια Developer License η οποία περιλαμβάνει όλες τις δυνατότητες του λογισμικού.
  • Για την εκτέλεση των εφαρμογών που έχουν αναπτυχθεί με χρήση του ABBYY FineReader Engine 11 απαιτείται η προμήθεια Runtime License. Υπάρχει η δυνατότητα επιλογής ανάμεσα σε άδεια με δυνατότητα επεξεργασίας συγκεκριμένου πλήθους σελίδων ανά έτος ή με δυνατότητα απεριόριστων σελίδων αλλά περιορισμό στο πλήθος των πυρήνων του επεξεργαστή που μπορεί να χρησιμοποιήσει η εφαρμογή.

 


Copyright © 1999,2015 IID S.A. All rights reserved

For information contact: