Un ocr gratuito : MoreData
Qui trovate un ocr gratuito con licenza d’uso illimitata ed ‘as is’(si veda la licenza per ulteriori informazioni) ,utile per l’acquisizione di testo e l’esportazione di testo verso altri applicativi,il raggiungimento di un risultato soddisfacente dipende dalla qualità dell’immagine , nella maggioranza dei casi partendo da un immagine di buona qualità senza elementi grafici esterni al documento principale il risultato è ottimo,spesso per un uso di taggatura il risultato è accettabile anche partendo da screenshot dello schermo.
Il programma è un software generalmente adatto alla catalogazione di immagini con contenuto testuale.
Caratteristiche funzionali:
- il programma permette di analizzare un file immagine e ricavarne il testo contenuto (fig1)
- il programma permette di salvare il testo estratto in un file di testo con un click (fig2)
- il programma permette anche di acquisire il testo da piu’ immagini in una sola volta,ad esempio si può decidere di analizzare tutte le immagini sotto la directory “FaxRicevuti” o “Fatture” con un solo passaggio
-il programma permette di ricercare nel vostro patrimonio di immagini analizzate : è presente una funzione di ricerca con la quale potete trovare quali immagini da voi analizzate tramite il software contengono una determinata parola,vi verrà restituita in una griglia la lista di immagini che soddisfa questa condizione,l’esito negativo della ricerca non significa con assoluta certezza che la parola non sia presente nell’immagine in quanto il software potrebbe non essere riuscito a recuperarla con successo ( fig3 )
-il programma permette eventualmente ma non obbligatoriamente di selezionare un livello di accuratezza che può migliorare il risultato finale, nel caso vogliate utilizzare questa funzione potete cambiare il valore nel combobox da low ad un altro valore oppure inserire un valore manuale consiglio valori tra 70 e 160,questo funzione può evitare di dover ritagliare l’immagine per tagliare elementi di contorno non pertinenti purchè in altra lingua oppure non costituiti da parole di senso compiuto oppure graficamente poco chiare ,la caratteristica è in prealpha e gli utilizzatori sono invitati a postare eventuali problemi come commenti all’articolo con un minimo di descrizione
-se vi interessa vedere l’immagine originale corrispondente alla parola cercata potete aprirla cliccando sul tasto “open image”,si aprirà l’immagine corrispondente alla riga da voi selezionata nella griglia dei risultati (è sufficiente cliccare su una riga per selezionarla)
-il programma supporta inglese italiano e francese e riesce a recuperare molto testo anche da documenti in altre lingue purchè usino caratteri occidentali
-il software non scrive nessuna chiave di registro sul vostro computer non richiedendo installazione .
Come si usa :
1) scaricate il file seguendo il link di download, dezippate il tutto in una directory a vostra scelta,questa sarà la directory di lavoro del programma,
2) per eseguire il programma cliccate direttamente sul file eseguibile MoreDataEvolution.exe questo aprirà l’interfaccia grafica del programma,per vostra comodità potreste creare un link sul desktop dell’eseguibile moredataevolution.exe, tasto destro sul file moredataevolution.exe >>> invia a >>> desktop (crea collegamento)
Requisiti ed avvertenze:
-il software richiede per il suo funzionamento la presenza sul vostro pc del framework .net 3.5 ,è un software completamente gratuito,mettete le parole “framework .net 3.5″ evidenziate in un motore di ricerca per trovarlo nel caso non sia già presente sulla vostra macchina,l’applicazione richiede una risoluzione 1280 * 1024 o superiore.
-l’uso del programma richiede che l’utente faccia una copia di sicurezza dei dati che intende analizzare con il programma stesso
-tutti i file che trovate dentro lo zip dopo essere stati dezippati devono restare all’interno di una stessa directory a vostra scelta.
Per suggerimenti,eventuali segnalazioni di errori od altro potete scrivere un email all’autore.,eventualmente potete allegare il file log_more_data,
Scarica il programma
Caratteristiche teniche: il software è composto da due eseguibili ,uno che gestisce l’interfaccia utente chiamato MoreDataEvolution.exe ed uno chiamato ConsoleRunner.exe che si occupa della gestione delle immagini, utilizza tramite un ottimo wrapper l’engine tesseract ,progetto opensource di google,originariamente sviluppato da hp.
Potete inviare errori riscontrati e richieste di nuove funzionalità anche come commenti a quest’articolo.
luglio 14th, 2009 at 18:20
Ciao, cercavo un programma simile e credo con questo di averlo trovato.
Purtroppo non riesco a usare la ricerca. Hai un’idea di come si faccia?
Inoltre pur potendogli far “leggere” con l’OCR un insieme di documenti, la generazione dei file di testo per la successiva ricerca va lanciata 1 riga alla volta.
Ti sarei grato se mi potessi aiutare su quanto sopra.
Cordiali saluti.
Enrico
febbraio 21st, 2010 at 18:30
ciao per la ricerca devi inserire un termine che pensi ci sia nelle immagini scannerizzate e ti torna una lista nella griglia solo di quelle che contengono la parola,per quanto riguarda la generezione dei file di testo attualmente è del singolo file terrò presente la tua osservazione per futuri sviluppi
ciao
marzo 5th, 2010 at 23:56
Ottimo articolo!! ;) Grazie mille.