4 outils d'OCR en ligne gratuits mis à l'épreuve

4 outils d'OCR en ligne gratuits mis à l'épreuve / l'Internet

Si vous souhaitez convertir un texte imprimé en texte numérique que vous pouvez copier, coller, modifier et rechercher, vous devez utiliser des scanners à reconnaissance optique de caractères (OCR)..

Lorsque vous choisissez de numériser ou de prendre une photo d'un document, celui-ci sera enregistré dans un format tel que JPEG ou PDF. Le logiciel OCR peut ensuite reconnaître les lettres et les chiffres contenus dans ces documents et les convertir en PDF interrogeable. 4 méthodes de création et de modification de fichiers PDF gratuites 4 méthodes de création et de modification de fichiers PDF gratuites Tous les types de fichiers courants trouvés dans notre En ce qui concerne le monde informatique, le format PDF est probablement l’un des plus restrictifs, tout en étant accessible à tout le monde (principalement à lire)… En savoir plus, ou dans un fichier que vous pouvez modifier dans des programmes tels que Microsoft Word.

Le problème est que certains scanners OCR fonctionnent beaucoup mieux que d'autres, les meilleurs étant assez lourds pour le portefeuille..

Omnipage18, par exemple, coûte 150 dollars, mais est particulièrement efficace pour reconnaître différentes langues. Adobe Acrobat Pro DC coûte 400 dollars, mais sa précision est incroyable. ABBYY FineReader coûte 150 USD, mais est fantastique pour convertir des documents tels que des magazines et des brochures en texte interrogeable. Nous testerons l'offre en ligne d'ABBYY plus tard dans cet article..

Cependant, si vous recherchez des alternatives gratuites que vous pouvez Télécharger et utiliser sous Windows ou OS X, vous devriez essayer ces outils de ROC Les 5 meilleurs outils de ROC pour extraire du texte à partir d’images Les 5 meilleurs outils de ROC pour extraire du texte à partir d’images Lorsque vous avez des rames de papier, comment obtenir tout ce texte imprimé converti en quelque chose qu'un programme numérique pourra reconnaître et indexer? Gardez un bon logiciel OCR à proximité. Lire la suite . Mais si vous préférez utiliser un logiciel gratuit, en ligne Outil OCR, continuez à lire, car nous avons essayé les meilleurs, avec les résultats ci-dessous.

Le test

Il semble que la plupart des gens utilisent désormais leur smartphone pour numériser pour eux. Numérisez et gérez vos reçus, économisez de l'espace, du papier et du temps Numérisez et gérez vos reçus, économisez de l'espace, du papier et de l'heure Les accusés de papier sont facilement perdus et difficiles à trouver quand vous en avez besoin plus. Heureusement, le passage au numérique résout ces deux problèmes. En savoir plus, j'ai décidé d'utiliser l'application Scannable (gratuite sur iOS et Android) d'Evernote. J'ai scanné la première page de Richard Dawkin Mont grimpant improbable, pour voir quels résultats nous pourrions obtenir avec un formatage très basique. J'ai aussi scanné une page de Tim Ferriss ' Le chef de 4 heures essayer les scanners avec un formatage légèrement plus compliqué. J'ai sauvegardé chacun de ces fichiers au format PDF.

Ces documents ont ensuite été passés en revue avec l’un des supposés meilleurs outils de ROC en ligne pour vérifier leur efficacité..

OCR en ligne gratuit

Heureusement, aucune inscription n'est requise pour utiliser l'OCR en ligne gratuit. Et j’ai été doublement impressionné quand j’ai vu leur volonté de conserver la mise en forme et la mise en page de mon document.

Le site prétend pouvoir prendre en charge les formats PDF, GIF, BMP, JPEG, TIFF et PNG en tant qu'entrée. Les sorties peuvent être DOC, un document texte PDF, RTF et TXT. Malheureusement, je n'ai pas pu savoir s'ils avaient une limite de taille de fichier.

Document de base en PDF
Converti absolument parfaitement. Il n'y a pas beaucoup plus à dire! Nous sommes à un très bon départ.

Document de base à DOC
Les mots réels semblent avoir parfaitement converti, mis à part le “quantité” de “Mont Rushmore” en quelque sorte va AWOL. La mise en forme est une histoire différente, cependant. De nombreuses virgules ont été remplacées par des traits de soulignement et des espaces aléatoires ont été insérés à des endroits différents du document. Quand vous verrez plus tard comment se comportera le logiciel premium dans ce test, ce n'est pas un mauvais effort du tout.

Document complexe en PDF
La conversion du document a pris 120 secondes! Une fois terminé, tout le texte avait été converti avec une précision d’environ 95%, bien que le texte dans la zone séparée en haut à droite de la page ne puisse pas être recherché. Quelques autres caractères du PDF étaient également incorrects.

Document complexe à DOC
Cette fois, la conversion ne prend que 10 secondes et le texte est à nouveau converti avec une précision d’environ 95%. Il y avait quelques problèmes d’espacement, et le logiciel avait du mal à convertir la police en haut à droite du document et manquait quelques caractères ici et là..

Verdict
Si vous souhaitez convertir des documents simplement formatés en PDF, cet outil est fantastique. Pour ce qui est de la conversion au format DOC, les résultats obtenus n’ont rien à raconter..

i2OCR

i2OCR fait des déclarations impressionnantes. L'outil reconnaît plus de 60 langues, peut gérer les dispositions multi-colonnes (en supprimant la mise en forme), n'a pas de limite de taille de fichier, peut convertir les fichiers téléchargés. et à partir d'URL. Et vous n'avez pas besoin de vous inscrire pour utiliser cet outil non plus.

Le service fonctionne en extrayant simplement le texte de votre image, puis en générant du texte non formaté. Vous pouvez corriger rapidement les erreurs éventuelles dans la vue côte à côte avant de copier le texte dans d'autres programmes ou de le télécharger au format DOC, PDF ou HTML..

Remarque: lorsque j'ai essayé de télécharger mes documents PDF, ceux-ci ont été rejetés par i2OCR. Je devais donc les convertir au format JPEG (en prenant une capture d'écran de ceux-ci, puis en téléchargeant les fichiers)..

Document de base en texte brut
En raison du fonctionnement de cet outil, toute la mise en forme est perdue, bien que la conversion d’image en texte soit presque parfaite. Il y avait quelques petites erreurs telles que l'espacement des paragraphes, et quelques virgules ont été remplacées par des points, mais ce sont de petits problèmes.

Document complexe en texte brut
La majorité du texte a été convertie sans trop d'erreurs, à part le titre et la recette en haut à droite, ce qui était illisible pour cet outil. La manière dont les colonnes ont été converties en texte brut était loin d'être idéale. Si vous voulez rendre cette conversion réalisable, il vous faudra beaucoup de temps pour réorganiser les lignes en phrases cohérentes..

Verdict
I2OCR fonctionne très bien pour les documents de base. La possibilité de modifier le texte avant de télécharger est également une très bonne idée. Cependant, pour les documents plus complexes, la conversion est encore assez précise, mais la façon dont le texte est imprimé ne vous simplifiera pas la vie..

OCR en ligne

L'OCR en ligne prend actuellement en charge 46 langues différentes et peut convertir les formats PDF, JPG, BMP, TIFF et GIF au format Word, Excel ou Texte brut. Le site prétend “les documents convertis ressemblent exactement à l'original - tableaux, colonnes et graphiques”.

La version que vous pouvez utiliser sans vous enregistrer vous permet de convertir jusqu'à 15 images par heure (limite de 5 Mo). Si vous vous inscrivez pour un compte, vous pouvez acheter plus de pages en plus de cette limite, tout en étant également capable de convertir des documents de plusieurs pages et des archives ZIP..

Document de base à DOC
Le document de base parfaitement converti en dehors du chiffre romain je ne pas être ramassé. Comme promis par le site, la mise en forme était exactement comme dans le livre. Bravo à cet outil.

Document complexe à DOC
Après avoir été déçu par les outils OCR précédents lors de la conversion du document complexe, j'ai été très impressionné par OCR en ligne. La mise en page était presque parfaite, comme vous pouvez le voir ci-dessus. Encore une fois, la recette n’a pas été bien comprise, mais toutes les autres erreurs mineures sont négligeables..

Verdict

Résultats absolument fantastiques de l'OCR en ligne. Le seul inconvénient que je vois est qu’il n’ya aucun moyen de télécharger les documents convertis au format PDF, car les formats de sortie mentionnés incluent DOCX, XLSX et TXT uniquement..

ABBYY FineReader Online (version d'évaluation de 10 pages)

Comme indiqué précédemment, ABBYY est l’un des leaders du marché des logiciels de reconnaissance optique de caractères (OCR), dont le programme complet et téléchargeable coûte environ 150 USD. Ils offrent un Essai gratuit de 10 pages pour leur outil en ligne, cependant (inscription requise). Pour un abonnement de 5 $, leur outil en ligne vous permettra de convertir 200 pages par mois..

Les fichiers acceptés peuvent atteindre 100 Mo, dans l’un des formats suivants: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP et PNG. ABBYY reconnaît également près de 200 langues. Les sorties sont particulièrement impressionnantes, avec un choix entre DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 et EPUB.

Vous pouvez même essayer quelques fonctionnalités BETA lors de votre essai. La première est la possibilité de traduire votre document dans une autre langue. L’autre consiste à exporter votre document converti vers votre compte de stockage dans le cloud, qu’il s’agisse de Dropbox, Google Drive, Evernote, Microsoft OneDrive ou Box..

Document de base à DOCX
Dans l'ensemble, les résultats ont été bons, mais pas étonnants, car il s'agit d'un produit haut de gamme. Plusieurs virgules et points ont été intervertis, plusieurs guillemets ont été remplacés par un astérisque, il manquait quelques lettres majuscules et un mot (littéraliste) était mal orthographié..

Document complexe à DOCX
Une fois la conversion effectuée, il y avait très peu de fautes dans le texte du document (à part l'OCR qui luttait à nouveau avec la police de cette recette!), Mais la mise en forme laissait beaucoup à désirer..

Les trois colonnes ont en quelque sorte pris deux pages, avec la colonne centrale seulement figurant sur la deuxième page. Si vous vouliez réellement faire quoi que ce soit avec ce document converti, vous finissez par vous arracher les cheveux.

Document de base en PDF
Lors de l'examen du fichier PDF converti, je n'ai trouvé aucune anomalie. Peut-être avons-nous trouvé où ABBYY excelle. Des résultats fantastiques.

Document complexe en PDF
Encore une fois, je n'ai trouvé aucune erreur dans ce fichier converti. ABBYY sait évidemment convertir exceptionnellement bien en PDF.

Verdict
Si vous êtes content de payer quelques dollars, la conversion au format PDF semble fonctionner extrêmement bien avec ce service, et il est particulièrement utile de pouvoir synchroniser des fichiers convertis sur votre stockage en nuage si vous numérisez un grand volume de documents. Cependant, comme pour les autres options, ABBYY n’a toujours pas compris comment convertir parfaitement des documents au format DOC pour une édition facile..

Le résultat final

Si, comme la plupart des gens, vous souhaitez numériser quelques articles de magazine et des factures de ménage, vous n'avez pas besoin de modifier ces documents. Par conséquent, la conversion directe en PDF vous conviendra, car vous pourrez toujours effectuer une recherche dans ces documents. Pour cela, OCR gratuit en ligne était définitivement le meilleur outil gratuit que nous ayons testé. Cela étant dit, si vous êtes prêt à payer 5 dollars par mois pour une qualité presque parfaite, FineReader Online d'ABBYY était légèrement plus précis..

En ce qui concerne la conversion de documents au format DOC, nous n’avons pas réussi à trouver une solution parfaite, mais de loin les meilleurs résultats ont été obtenus avec l’OCR en ligne. La conversion n'était pas parfaite, mais l'intégrité de la mise en forme était en grande partie préservée et les erreurs négligeables. Lorsque nous comparons ces résultats à la “prime” En proposant ABBYY, vous ne pouvez pas vous empêcher d'être massivement impressionné.

Nous n'avons pas inclus les fonctionnalités d'OCR de Google Drive dans cet article. un peu pour le caractère universel de Google, mais plutôt pour le fait que nous voulions tester quelques autres services d'OCR en ligne gratuits.

À vous de voir: quels autres outils d’OCR en ligne recommanderiez-vous à nos lecteurs? Et qu'avez-vous essayé que vous n'utiliseriez plus jamais?

En savoir plus sur: Conversion de fichier, OCR.