Qui trovate un ocr gratuito con licenza d’uso illimitata ed ‘as is’(si veda la licenza per ulteriori informazioni) ,utile per l’acquisizione di testo e l’esportazione di testo verso altri applicativi,il raggiungimento di un risultato soddisfacente dipende dalla qualità dell’immagine , nella maggioranza dei casi partendo da un immagine di buona qualità senza elementi grafici esterni al documento principale il risultato è ottimo,spesso per un uso di taggatura il risultato è accettabile anche partendo da screenshot dello schermo.

Il programma è un software generalmente adatto alla catalogazione di immagini con contenuto testuale.

Caratteristiche funzionali:

- il programma permette di analizzare un file immagine e ricavarne il testo contenuto (fig1)

- il programma permette di salvare il testo estratto in un file di testo con un click (fig2)

- il programma permette anche di acquisire il testo da piu’ immagini in una sola volta,ad esempio si può decidere di analizzare tutte le immagini sotto la directory “FaxRicevuti” o  “Fatture” con un solo passaggio

-il programma permette di ricercare nel vostro patrimonio di immagini analizzate : è presente una funzione di ricerca con la quale potete trovare quali immagini da voi analizzate tramite il software contengono una determinata parola,vi verrà restituita in una griglia la lista di immagini che soddisfa questa condizione,l’esito negativo della ricerca non significa con assoluta certezza che la parola non sia presente nell’immagine in quanto il software potrebbe non essere riuscito a recuperarla con successo ( fig3 )

-il programma permette eventualmente ma non obbligatoriamente di selezionare un livello di accuratezza che può migliorare il risultato finale, nel caso vogliate utilizzare questa funzione potete cambiare il valore nel combobox da low ad un altro valore oppure inserire un valore manuale consiglio valori tra 70 e 160,questo funzione può evitare di dover ritagliare l’immagine per tagliare elementi di contorno non pertinenti purchè in altra lingua oppure non costituiti da parole di senso compiuto oppure graficamente poco chiare ,la caratteristica è in prealpha e gli utilizzatori sono invitati a postare eventuali problemi come commenti all’articolo con un minimo di descrizione

-se vi interessa vedere l’immagine originale corrispondente alla parola cercata potete aprirla cliccando sul tasto “open image”,si aprirà l’immagine corrispondente alla riga da voi selezionata nella griglia dei risultati (è sufficiente cliccare su una riga per selezionarla)

-il programma supporta inglese italiano e francese e riesce a recuperare molto testo anche da documenti in altre lingue purchè usino caratteri occidentali

-il software non scrive nessuna chiave di registro sul vostro computer non richiedendo installazione .

Come si usa :

1) scaricate il file seguendo il link di download, dezippate il tutto in una directory a vostra scelta,questa sarà la directory di lavoro del programma,

2) per eseguire il programma cliccate direttamente sul file eseguibile MoreDataEvolution.exe questo aprirà l’interfaccia grafica del programma,per vostra comodità potreste creare un link sul desktop dell’eseguibile moredataevolution.exe, tasto destro sul file moredataevolution.exe >>> invia a  >>> desktop (crea collegamento)

Requisiti ed avvertenze:

-il software richiede per il suo funzionamento la presenza sul vostro pc del framework .net 3.5 ,è un software completamente gratuito,mettete le parole “framework .net 3.5″ evidenziate in un motore di ricerca per trovarlo nel caso non sia già presente sulla vostra macchina,l’applicazione richiede una risoluzione 1280 * 1024 o superiore.

-l’uso del programma richiede che l’utente faccia una copia di sicurezza dei dati che intende analizzare con il programma stesso

-tutti i file che trovate dentro lo zip dopo essere stati dezippati devono restare all’interno di una stessa directory a vostra scelta.

Per suggerimenti,eventuali segnalazioni di errori od altro potete scrivere un email all’autore.,eventualmente potete allegare il file log_more_data,

Scarica il programma

Caratteristiche teniche: il software è composto  da due eseguibili ,uno che gestisce l’interfaccia utente chiamato MoreDataEvolution.exe ed uno chiamato ConsoleRunner.exe che si occupa della gestione delle immagini, utilizza tramite un ottimo wrapper l’engine tesseract ,progetto opensource di google,originariamente sviluppato da hp.

Potete inviare errori riscontrati e richieste di nuove funzionalità anche come commenti a quest’articolo.

Share and Enjoy:
  • Print
  • Digg
  • Sphinn
  • del.icio.us
  • Facebook
  • Mixx
  • Google Bookmarks
  • Blogplay
  • MSN Reporter
  • MyShare
  • MySpace
  • Segnalo
  • StumbleUpon
  • Technorati
  • Twitter
  • Yahoo! Bookmarks
  • Yahoo! Buzz