artykuły

FineReader 4 Sprint - Test programu

14:00
pon, 1 lipiec 2002
W niniejszym artykule opisujemy i testujemy popularny program do rozpoznawania druku (OCR) - FineReader 4.0 w wersji Sprint.

Wstęp

Zgadnijcie o czym będzie??? Tak, o wersji 4.0 programu OCR, ABBYY FineReader 4.0 Sprint. Ogólnie już na wstępie chciałbym zauważyć, że osobiście uważam ów program za drugorzędny, po Recognicie. Ale nie o tym miała być tutaj mowa. FineReader 4.0 to program przeznaczony nie tylko dla biur i pracowni informatycznych. Został on także udostępniony domowym użytkownikom. Każdy kto posiada skaner, może z niego skorzystać. Obecna wersja posiada wiele udogodnień, niemniej jednak nie jest rozbudowana aż tak jak 5.0 z którą zdążyłem się ostatnio zetknąć. Niestety nie posiadam Full'a 5'tki, dlatego zajmiemy się czwórką.

Ogólnie o programie

Jak już wspomniałem wiele użytecznych funkcji ułatwia nam pracę. Wersja (4.0) umożliwia:

  • Rozpoznawanie tabel
  • Rozpoznawanie tekstu w 53 językach!!!
    Afrykanerski, Albański, Angielski, Baskijski, Białoruski, Bretoński, Bługarski, Chorwacki, Czeczeński, Czeski, Duński, Duński (Belgia), Estoński, Fiński, Francuski, Grecki, Hawajski, Hiszpański, Holenderski, Indonezyjski, Irlandzki, Isladzki, Kabardia, Kataloński, Litewski, Macedoński, Moaryjski, Młodawski, Niemiecki, Niemiecki (nowa pisownia), Norweski, Norweski (Bokmar), Norweski (Nynorsk), Osecki,Polski, Portugalski, Portugalski (Brazylia), Retroromański, Rosyjski, Rumuński, Samoański, Serbski, Swahili, Szwedzki, Słowacki, Sloweński, Tagalog, Tatarski (Krym), Turecki, Ukraiński, Włoski, Węgierski, Fiji, Łacina, Łotewski, a także cyfry.
  • Kompatybilność ze standardem TWAIN.
  • Skanowanie i rozpoznawanie za “jednym kliknięciem myszy”.
  • Możliwość samodzielnego skanowania przy własnych ustawieniach rozdzielczości i jasności. 
  • Możliwość ręcznego uruchomienia procesu rozpoznawania.
  • Możliwość ręcznego zaznaczania obszarów.
  • Przeglądanie efektów rozpoznawania. 
  • Zaznaczenie kolorem niepewnie rozpoznanych znaków.
  • Zapisywanie efektów rozpoznawania w plikach TXT i RTF.
  • Możliwość wysłania efektów rozpoznawania do aplikacji MS Word, Word Pro, WordPerfect, MS Excel.
  • Możliwość przetwarzania wielu obrazków.

Rozpoznawanie

Cały proces sprowadza się do uruchomienia programu i kliknięciu jednego przycisku (Skanuj&Czytaj) i to wszystko. Skanujemy w ten sposób nasz dokument, po czym program rozpoznaje znaki i konwertuje wszystko na formę tekstową.
Bardzo fajną rzeczą jest zmiana koloru niepewnie "przetłumaczonego" wyrazu. Jeśli program nie jest "pewien" czy dany wyraz wyglądać ma tak, czy inaczej, wówczas zmienia jego kolor na zielony (szczerze mówiąc jeszcze nie znalazłem opcji umożliwiającej wyłączenie tego triku :)
Przycisk "Skanuj" umożliwia nam zeskanowanie dokumentu, bez jego rozpoznawania.
Efekty rozpoznawania tekstu możemy zapisać do pliku *.txt lub *.rtf lub wyeksportować do Word'a, Excel'a, WordPro, WordPerfect.
Jeżeli posiadamy dokument z grafiką, program powinien sobie poradzić. Cwaniak rozróżnia grafikę od tekstu, nie dość, ponadto zamieszcza ją jeszcze w naszym dokumencie w postaci elektronicznej.
Proces rozpoznawania przebiega bardzo szybko, zwykle jedna strona zostaje skonwertowana w przeciągu zaledwie 8 sekund. Więc już po 8'śmiu sekundach mamy gotowy dokument do zapisu.
Jak każdego innego, FinReader'a nie omijają błędy. Stronę demonstracyjną, zawierającą tebelę, tekst i grafikę przeczytał szybko, ale z błędami. Zawsze po takim procesie powinniśmy przenieść dokument do Word'a i poprawić w nim błędy.
Co udało mi się zauważyć, strony pełne tekstu np. książki czyta sprawnie, szybko i dosłownie.... prawie bezbłędnie :) Na jedną stronę przypada średnio 1 błąd w rozpoznaniu.
Poniżej znajdziesz wynik pracy rozpoznawania części strony demonstracyjnej. Zauważ, że wystąpiły na niej błędy.

P 
rzez długi czas zastanawiano się jak 
nauczyć maszynę umiejętności człowieka - 
a konkretnie jak stworzyć maszynę zdolną 
czytać tekst. W ciągu ostatnich 50 lat to marzenie 
zaczęło stawać się rzeczywistością. 
Rozpoznawanie pisma jest jednym z 
kluczowych problemów AI1. Istnieje rozwiązanie 
bliskie ludzkiej umiejętności czytania - z użyciem 
zasad rozpoznawania obrazu przez organizmy 
żywe. Jest to metoda technologia adaptacyjnej 
percepcji celowościowej.

Taki tekst da się jednak odczytać. Sprawdzimy teraz jak program FineReader poradzi sobie z książką (a bliżej z fragmentem QuoVadis :)

przybyciem poczęto
znów sobie szeptać, że jednak nastąpi zapewne coś nadzwyczajnego, gdyż
Neronowi prócz Tygellina i Watyniusza
towarzyszył Kasjusz, centurion olbrzymiej
postawy i olbrzymiej siły, którego cezar brał z sobą tylko wówczas, gdy
chciał mieć przy boku obrońcę, na przykład gdy przychodziła mu ochota do
nocnych wypraw na Suburę, gdzie urządzał
sobie zabawę zwaną sagatio, polegającą na
podrzucaniu w górę na wojskowym płaszczu napoty­kanych po drodze dziewcząt.
Spostrzeżono także, że w samym am­fiteatrze
zostały przedsięwzięte pewne środki ostrożności. Straże pretoriańskie
powiększono, komendę zaś nad nimi miał nie centu­rion, ale trybun Subriusz
Flawiusz, znany dotychczas ze ślepego przywiązania
do Nerona. Zrozumiano wówczas, że cezar pragnie się na wszelki wypadek
ubezpieczyć przed wybuchem rozpaczy Winicjusza,
i ciekawość wzrosła jeszcze bardziej.
Wszystkie spojrzenia zwracały
się z natężonym zajęciem na miejsce, na którym siedział nieszczęsny
oblubieniec. On zaś blady bardzo, z czołem pokrytym kroplami potu, niepewny był
jak i inni widzowie, ale zaniepokojony do ostatnich głębin duszy. Petroniusz,
sam nie wiedząc dokładnie, co nastąpi, nie powiedział mu nic, tylko
zapytał go, wróciwszy od Nerwy, czy gotów jest na wszystko, a nastę­pnie,
czy będzie na widowisku. Winicjusz
odpowiedział na oba pytania: „Tak!",
ale przy tym mrowie przeszło mu przez całe ciało, domyślił się bowiem, że
Petroniusz nie pyta bez przyczyn. Sam on żył
już od niejakiego czasu jakby tylko półżyciem,
sam pogrążył się w śmierci i zgodził się na śmierć dla Ligii,
miała ona bowiem być dla nich obojga zarazem wyzwoleniem i ślubem, ale teraz
poznał, że inna rzecz jest myśleć z daleka o ostatniej chwili jak o
spokojnym zaśnięciu, a inna pójść patrzeć na męczarnie istoty droższej
nad życie. Wszystkie dawniej przebyte bóle odezwały się w nim na nowo.
Uciszona rozpacz poczęła znów krzyczeć w duszy, ogarnęła go dawna chęć
ratowania Ligii za wszelką cenę. Od rana chciał się dostać do cuniculów,
by się przekonać, czy Ligia w nich się
znajdu­je, ale straże pretoriańskie pilnowały wszystkich wejść i rozkazy
były tak surowe, że żołnierze, nawet znajomi, nie dali się zmiękczyć ni
prośbą, ni złotem. Winicjuszowi wydawało
się, że niepewność
                                      541

 Jak widać rozpoznawanie przebiegło prawie bezbłędnie. Wyrazy pogrubione to słowa, których program nie był pewien/ lub które nie występują w jego słowniku. Jednak wszystkie odczytał prawidłowo.

Dla kogo?

Jeśli dużo dokumentów przepisujesz na formę elektroniczną ten program jest właśnie dla Ciebie. Jednak jeśli są to dokumenty napisane ręcznie, są marne szansę powodzenia. Tekst napisany ręcznie udało mu się odczytać następująco:

Oryginał:
  To jest tekst	
  napisany ręcznie.
         :)
Rozpoznane:
  To ieot któ 	
  nzoiptóci^u^ '^Cwu(,
Nigdy nie umiałem ładnie pisać... ;)

Zakończenie

Dość już wynudziłem więc kończę wypociny. Jeśli macie jakieś pytanka, ślijcie je na adres: lukas.home.page@gmail.com . To w zasadzie wszystko. Dodam jeszcze, że wersja "Sprint" nie ma zbyt rozwiniętych możliwości konfiguracyjnych, a dokładniej prawie w ogóle nie można nic skonfigurować. Dla większych zapaleńców polecam wersję Office 5.0.

12345
FineReader 4 Sprint - Test programu Autor opinii: Czytelnicy, data przesłania: 0

Skomentuj

Aby zamieścić komentarz, proszę włączyć JavaScript - niestety roboty spamujące dają mi niezmiernie popalić.






Komentarze czytelników

    Nie ma jeszcze żadnych komentarzy.
    Dexter