Quel est le meilleur programme OCR ou ICR gratuit pour la transcription de manuscrits?

Quel est le meilleur programme OCR ou ICR gratuit pour la transcription de manuscrits? / Demandez aux experts

Javier demande:

Je suis un écrivain de nouvelles et de contes. Je recherche un programme gratuit de reconnaissance optique de caractères (OCR) ou de reconnaissance intelligente de caractères (ICR) pour numériser mes anciens manuscrits à partir d'images ou de photographies afin de les convertir en fichiers Microsoft Word..

Existe-t-il des programmes gratuits et précis capables de le faire? Malheureusement, je n'ai pas de scanner, mais j'ai accès à un appareil photo numérique d'une résolution de 20 mégapixels..

La réponse de Kannon:

Comme vous l'avez déjà mentionné, il existe plusieurs types de technologies de reconnaissance de caractères capables de convertir automatiquement l'écriture manuscrite ou dactylographiée en caractères numériques. Le niveau de précision de ces types de logiciels varie considérablement entre les différentes implémentations. Certains convertissent lettre à lettre et d'autres peuvent convertir des mots entiers. Il existe trois catégories générales de ce logiciel:

  • Reconnaissance Optique de Caractères (OCR)
  • Reconnaissance Intelligente de Caractères (ICR)
  • Reconnaissance intelligente des mots (IWR)

Reconnaissance optique de caractères

En réalité, OCR est un terme générique et souvent, toutes les méthodes décrites dans cet article sont désignées par OCR - Wikipedia donne à OCR sa propre classification, mais les implémentations modernes tendent à regrouper plusieurs méthodes. Alors, que fait-il? OCR convertit des lettres individuelles dactylographiées ou manuscrites en caractères numériques. Ainsi, le logiciel examine un document et tente ensuite de le convertir en texte brut en devinant la nature de chaque caractère..

Le logiciel n'est pas parfait. Le logiciel OCR peut mal interpréter des caractères individuels d'apparence similaire, entraînant des mots mal orthographiés et des résultats imprécis. La plupart du temps, les utilisateurs peuvent copier le texte généré par un programme OCR dans un traitement de texte et corriger automatiquement les fautes d'orthographe. Souvent, les erreurs apparaissent sous forme de caractères similaires. Par exemple la lettre “ré” pourrait être représenté comme “cl”.

Mais en ce qui concerne les textes manuscrits, l'OCR ne fait pas très bien. Au moins, la majorité des implémentations libres sont tragiquement mauvaises. Certains produits commerciaux peuvent vraiment transcription manuscrite, mais leur prix les met totalement hors de portée du grand public. Par exemple, il y a le logiciel OCR ReadSoft de Lexmark. Ce logiciel réservé aux entreprises coûte milliers de dollars.

Reconnaissance intelligente des caractères

ICR est un sous-ensemble d'OCR spécialisé dans la conversion de texte manuscrit en caractères numériques individuels. Étant donné que vos notes et manuscrits sont manuscrits, un programme ICR est le plus utile. Cependant, je ne sais pas avec quelle précision ils peuvent convertir des textes écrits en langues étrangères, tels que l'espagnol. Comme avec l'OCR, les utilisateurs peuvent améliorer la qualité des textes sortis en les copiant dans un traitement de texte avec la correction orthographique activée, puis en corrigeant les corrections à la main..

Reconnaissance intelligente des mots

La dernière évolution de l'OCR et de l'ICR est le logiciel Intelligent Word Recognition. Plutôt que de reconnaître des caractères individuels, il tente de traduire des mots manuscrits entiers. Comme OCR et ICR, la reconnaissance intelligente des mots mal traduit souvent les mots et oblige l'utilisateur à corriger manuellement les erreurs.

Quel est le meilleur logiciel OCR gratuit??

Tesseract

Il y a beaucoup d'options disponibles. Tesseract est probablement le meilleur Open source (et gratuit) logiciel OCR là-bas. À ma connaissance, il ne s'agit que de caractères individuels et non de mots entiers..

Parce que vous utilisez Microsoft Word (le meilleur correcteur orthographique personnalisable. Comment vérifier l'orthographe et la grammaire dans Microsoft Word? Comment vérifier l'orthographe et la grammaire dans Microsoft Word? Vous pouvez personnaliser les outils de vérification orthographique et grammaticale intégrés de Microsoft Word Vous pouvez même utiliser la correction automatique pour accélérer votre saisie. Pour en savoir plus dans les entreprises), il vous suffit de copier le texte entier dans Word, puis d'exécuter une vérification orthographique pour éliminer les fautes d'orthographe..

Tesseract est en réalité un moteur OCR qui s’exécute à partir de la ligne de commande. Sauf si vous êtes prêt à faire face à la difficulté d'utiliser un outil de ligne de commande, vous voudrez probablement installer quelque chose de plus convivial. Il y a un téléchargeable “l'extrémité avant” (ou une interface utilisateur graphique) qui vous permet d’utiliser Tesseract comme outil de glisser-déposer: PDF OCR X. Installez d’abord le progiciel, puis exécutez-le. Vous verrez alors une fenêtre:

Ensuite, il vous suffit de glisser-déposer le fichier image sur la fenêtre. Une fois l'image chargée, lancez le logiciel de transcription OCR. Cela peut prendre une minute ou deux.

Malheureusement, cela s’est révélé totalement inadéquat pour la gestion de votre texte. Voici à quoi cela ressemble après l'extraction du texte du document:

Microsoft OneNote

Comme il semble que vous utilisiez déjà Microsoft Office, la meilleure option est probablement aussi celle de Microsoft. Je suppose que vous possédez une copie de Microsoft Office, qui inclut OneNote. Ceci vient équipé de la technologie OCR assez avancée.

En outre, à la fois sur iOS et Android, il y a aussi la lentille totalement gratuite de Microsoft Office, qui permet de convertir JPEG (et d'autres formats d'image) directement en texte. Ce qui rend les versions mobiles si merveilleuses, c'est que vous pouvez prendre une image, la télécharger sur le système informatique en nuage de Microsoft, puis exécuter l'extraction de texte à partir de OneNote sur un ordinateur de bureau..

Le processus est assez simple. Tout d'abord, prenez une photo de votre texte. Si vous avez décidé d'utiliser l'application OneNote, il vous suffira d'enregistrer le fichier sur votre compte OneDrive. Sinon, transférez l'image sur votre ordinateur et déposez-la sur OneNote..

Puis faites un clic droit sur l'image et sélectionnez Copie Texte de l'image du menu contextuel.

Puis cliquez avec le bouton droit sur une portion vierge de OneNote (ou dans une application de lecture de texte) et coller le texte dans. Le texte sorti de votre document ressemble à ceci:

Malheureusement, les résultats de OneNote ne le font pas nulle part près d'un bon travail, produisant un non-sens total. Cela peut être dû à une combinaison de facteurs, tels qu'une image déformée ou une écriture qui ne se fait pas en ligne droite, ou tout simplement parce que le logiciel n'est pas assez bon..

Google Keep

À l’heure actuelle, la meilleure solution pour l’OCR sur des documents manuscrits concerne l’apprentissage automatique: Plus précisément, l’apprentissage en profondeur. L'apprentissage en profondeur est une méthode sophistiquée de formation d'un ordinateur aux tâches auparavant remarquables, telles que la reconnaissance faciale. , Croyez-le ou non). Google a récemment acheté DeepMind, qui développe une technologie d'apprentissage en profondeur Des projets de recherche géniaux qui pourraient changer l'avenir Des projets de recherche novateurs qui pourraient changer l'avenir imaginez seulement maintenant? Ces projets de recherche passionnants disent que c'est une promesse qu'ils vont tenir. Lire la suite . Cette acquisition de clé a eu un effet important: Microsoft perd face à Google en OCR Microsoft contre Google - Qui dirige la course à l’intelligence artificielle? Microsoft vs Google - Qui dirige la course à l'intelligence artificielle? Les chercheurs en intelligence artificielle font des progrès tangibles et les gens recommencent à parler sérieusement de l'IA. Les deux titans menant la course à l'intelligence artificielle sont Google et Microsoft. Lire la suite . Pour le moment, Google propose l’une des méthodes les plus avancées (et gratuites): Google Keep..

Google Keep (que nous avons examiné pour la première fois en 2013 Simple Notes On The Go: Google Keep pour Android commenté Simple Notes On The Go: Google Keep pour Android commenté Il existe des applications de prise de notes étonnantes, mais en voici une qui mérite d'être examinée de plus près. : Google Keep, un archiviste qui possède à la fois une superbe application Android et une application Web épurée (en savoir plus), propose également une version mobile de leur application pour Android. Comme avec OneNote, vous pouvez prendre une photo et la transférer directement dans le nuage de Google. Il suffit de faire glisser l'image sur la fenêtre Google Keep. Cliquez ensuite sur le bouton de menu (trois points verticaux) et sélectionnez Saisir le texte de l'image du menu contextuel.

Voici à quoi cela ressemble après l'extraction du texte:

Google Keep gagne

Comme vous pouvez le constater, Google Keep domine la concurrence. Les résultats peuvent être encore améliorés en utilisant un outil d'édition d'image. 10 Outils gratuits de retouche photo pour tirer le meilleur parti de vos clichés 10 Outils gratuits pour éditeur de photo pour tirer le meilleur parti de vos clichés Quoi qu'il soit arrivé à tous les instantanés que vous avez pris dans le passé ? Si vous avez des projets et des idées, voici quelques outils Windows et des outils multiplateformes pour les traiter. Lire la suite pour augmenter le contraste et redresser l'image.

Espérons que ces options aident. Si vous avez besoin de plus d'options d'OCR, veuillez consulter les 5 meilleurs outils d'OCR. Les 5 meilleurs outils d'OCR pour extraire du texte à partir d'images. Les 5 meilleurs outils d'OCR pour extraire du texte à partir d'images. Quand vous avez des rames de papier, comment obtenir tout ce qui est imprimé texte converti en quelque chose qu'un programme numérique sera en mesure de reconnaître et d'indexer? Gardez un bon logiciel OCR à proximité. Lire la suite pour plus d'informations.

En savoir plus sur: OCR, Transcription.