Top 5 des outils logiciels OCR gratuits pour convertir des images en texte
Très franchement, j'aimerais connaître ce moyen simple d'utiliser un logiciel de ROC disponible gratuitement à l'époque de mes études. Bien sûr, nous n'avions ni téléphones portables avec appareil photo ni appareils photo numériques bon marché, mais cela n'aurait-il pas épargné des heures de copie des notes!
Ah, la technologie moderne est magnifique. prenez une image numérisée (ou prenez une photo à l'aide d'une caméra mobile / appareil photo numérique) et le logiciel presto-OCR extrait toutes les informations de l'image dans un format texte facilement modifiable.
Reconnaissance optique de caractères (OCR) est un système de conversion de fichiers d’images imprimées / manuscrites numérisées en un format de texte lisible par machine. Le logiciel OCR fonctionne en analysant un document et en le comparant avec les polices stockées dans sa base de données et / ou en notant les caractéristiques typiques des caractères. Certains logiciels OCR le font également passer par un correcteur orthographique. “deviner” mots non reconnus. Il est difficile d'obtenir une précision de 100%, mais la plupart des logiciels s'efforcent d'obtenir une approximation précise..
Peut-être avez-vous déjà rencontré notre précédent Comment extraire du texte à partir d'images (OCR) Comment extraire du texte à partir d'images (OCR) Comment extraire du texte à partir d'images (OCR) La meilleure façon d'extraire du texte d'une image est d'utiliser la reconnaissance optique de caractères (OCR). Nous vous montrons sept outils OCR gratuits pour le travail. Lire plus post et utilisé JOCR, un outil logiciel gratuit OCR. Ou vous avez peut-être défini votre préférence pour quelques outils de ROC en ligne. Encore une fois, si vous avez trouvé des moyens d’exploiter un logiciel de ROC pour des raccourcis de productivité, laissez-nous vous donner quelques outils supplémentaires pour jouer avec..
Nous allons examiner 5 logiciels gratuits d’OCR et pour commencer, voyons les deux oubliés déjà installés sur nos systèmes..
OCR avec Microsoft OneNote 2007
La fonction de reconnaissance optique des caractères de MS OneNote est un gain de temps considérable en ce qui concerne l’OCR occasionnel. Vous l'avez peut-être manqué; c'est appelé Copier le texte de l'image.
- Faites glisser une image numérisée ou une image enregistrée dans OneNote. Vous pouvez également utiliser OneNote pour agrafe une partie de l'écran ou une image dans OneNote.
- Faites un clic droit sur l'image insérée et sélectionnez Copier le texte de l'image. Le texte copié optiquement reconnu va dans le presse-papiers et vous pouvez maintenant le coller dans n’importe quel programme comme Word ou le Bloc-notes..
OneNote est la simplicité personnifiée. Mais ce n'est pas terrible pour les caractères manuscrits ou même flous. Mais pour un travail rapide, je suis tout pour le clip et le collage de OneNote.
OCR à l'aide de Microsoft Office Document Imaging
Un autre outil peu utilisé dans la famille Microsoft. C'est juste là sous Menu> Microsoft Office> Outils Microsoft Office> Microsoft Office Document Imaging.
Faire de la ROC à l'aide de l'outil de création d'image est un peu contraignant, car il accepte uniquement les formats TIFF (ou MDI). Mais ce n’est pas un problème car toutes les applications graphiques peuvent être utilisées pour convertir une image au format TIFF. Dans la capture d'écran ci-dessous, j'ai utilisé MS Paint pour convertir un fichier JPEG en fichier TIFF..
- Ouvrez le fichier dans Microsoft Office Document Imaging> Fichier> Ouvrir.
- Cliquez sur l'icône du petit œil: Reconnaître le texte à l'aide d'OCR.
- Cliquez sur l'icône MS Word-Envoyer du texte à Word.
- Un fichier MS Word s'ouvre avec le texte converti éditable.
- Vous pouvez également utiliser MS Paint pour sélectionner une zone spécifique et la copier dans le Presse-papiers. Ouvrir Imagerie documentaire MS Office > sélectionner Page - Coller la page copier la sélection pour OCR.
Encore une fois, MODI a géré le texte imprimé avec compétence, mais mon texte manuscrit a rencontré un “OCR exécuté mais ne reconnaissant pas le texte” rapide'. Bien sûr, essayez avec votre propre écriture.
Alors, laissons maintenant la famille Microsoft derrière nous et examinons trois outils gratuits appelés OCR Software.
SimpleOCR
La difficulté que je rencontrais avec la reconnaissance de l'écriture manuscrite à l'aide d'outils MS, aurait pu trouver une solution dans SimpleOCR. Mais le logiciel n'offre la reconnaissance de l'écriture que sous forme d'essai gratuit de 14 jours. Reconnaissance de l'impression de la machine si ne fait pas avoir des restrictions.
- Le logiciel peut être configuré pour lire directement à partir d'un scanner ou en ajoutant une page (formats jpg, tiff, bmp).
- SimpleOCR offre un certain contrôle sur la conversion grâce à la sélection de texte, à la sélection d'image et aux fonctionnalités de texte ignoré.
- La conversion en texte prend le processus dans une validation étape; un utilisateur peut corriger les incohérences dans le texte converti à l'aide d'un correcteur orthographique intégré.
- Le fichier converti peut être sauvegardé dans un format doc ou txt.
SimpleOCR fonctionnait bien avec un texte normal, mais sa gestion des mises en page multi-colonnes était un comedown. À mon avis, la précision de conversion des outils Microsoft était considérablement meilleure que celle de SimpleOCR..
SimpleOCR (v3.1) est un téléchargement de 9 Mo et est compatible avec Windows.
TopOCR
Exactement ce dont je parlais au début! TopOCR, contrairement au logiciel OCR typique, est davantage conçu pour les appareils photo numériques (au moins 3 MP) et les téléphones mobiles avec les scanners. Comme SimpleOCR, il a une interface à deux fenêtres - La source Image fenêtre et le Texte la fenêtre.
L'image provenant d'une caméra ou d'un scanner dans la fenêtre de gauche est convertie au format de texte dans l'éditeur de texte de droite. L’éditeur de texte fonctionne comme WordPad et peut utiliser le logiciel Microsoft Texte pour parler moteur.
- Le logiciel prend en charge les formats JPEG, TIFF, GIF et BMP.
- Les paramètres de l'image tels que la luminosité, la couleur, le contraste, la suppression de taches, la netteté, etc. peuvent être utilisés pour améliorer la lisibilité de l'image..
- Les paramètres de filtre de la caméra peuvent également être configurés pour améliorer l'image..
- Le fichier converti peut être sauvegardé dans une variété de formats-PDF, RTF, HTML et SMS.
- TopOCR fonctionne bien avec du texte rectiligne, mais l’échec habituel de l’OCR avec texte en colonne demeure.
- Cependant, le logiciel analyse bien une page mélangée (texte et graphiques) et traite le texte uniquement..
- Le logiciel fonctionne avec 11 langues.
Pour obtenir les meilleurs résultats avec votre appareil photo, lisez la page Comment obtenir les meilleurs résultats avec la page TopOCR.
TopOCR (v3.1) est un téléchargement de 8 Mo et est compatible avec Windows (non testé sur Vista).
FreeOCR
Ce logiciel gratuit d’OCR utilise le Tesseract OCR moteur. Le code OCR de Tesseract a été développé par HP Labs entre 1985 et 1995 et est actuellement utilisé par Google. Il est considéré comme l’un des moteurs d’OCR open source les plus précis du marché..
FreeOCR est une interface Windows simple pour ce code sous-jacent.
- Il prend en charge la plupart des fichiers image et des fichiers TIFF de plusieurs pages..
- Il peut gérer les formats PDF et est également compatible avec les périphériques TWAIN tels que les scanners.
- FreeOCR possède également une interface double fenêtre familière avec des paramètres faciles à comprendre..
- Avant de commencer le processus de conversion en un clic, vous pouvez ajuster le contraste de l'image pour une meilleure lisibilité..
FreeOCR (v.2.03) nécessite Microsoft Net 2.0 Framework. Le logiciel de 4,38 Mo compatible Windows XP / Vista peut également être téléchargé à partir de ce site alternatif.
Les outils OCR gratuits ont leurs propres limites. Et numériser une page nécessite beaucoup de résolution, de contraste et de clarté des polices. Du point de vue de l'utilisateur moyen, la précision à 100% de la reconnaissance optique des caractères reste un procédé passe-partout. Fonctionnement de l'image à texte (ou reconnaissance optique de caractères) Fonctionnement de l'image à texte (reconnaissance optique de caractères) Extraire du texte en images n'a jamais été aussi facile c’est aujourd’hui grâce à la technologie de reconnaissance optique de caractères (OCR). Mais qu'est-ce que l'OCR? Et comment fonctionne l'OCR? Lire la suite .
Le logiciel OCR gratuit que je choisirais
Bien que les outils gratuits conviennent au texte imprimé, ils échouent avec le texte manuscrit cursif normal. Ma préférence personnelle pour une utilisation spontanée de la reconnaissance optique des caractères s’appuie sur les deux produits Microsoft mentionnés au début..
Votre propre mot compte. Quel est votre outil de choix? Le logiciel gratuit d'OCR reconnaît-il ce que vous traversez? Et plus important encore, reconnaissez-vous ce qu’ils vous jettent? Laissez nous savoir!
Notez que si vous recherchez des résultats professionnels, vous devez essayer un logiciel OCR professionnel. Logiciel OCR gratuit contre logiciel rémunéré: Microsoft OneNote et Nuance OmniPage Logiciel comparé gratuit / OCR rémunéré: Microsoft OneNote et Nuance OmniPage. Le logiciel de scanner OCR comparé vous permet de convertir texte dans des images ou des PDF en documents texte modifiables. Un outil de ROC gratuit comme OneNote est-il suffisant? Découvrons-le! En savoir plus, comme Nuance OmniPage.
Crédit d'image: kalleboo
En savoir plus sur: Image Editor, OCR.