Le meilleur logiciel (gratuit) de synthèse vocale pour Windows
À la recherche du meilleur libre Logiciel de synthèse vocale Windows? Le plus répété payé recommandation est Dragon Naturally Speaking (DNS). Mais certains pourraient se moquer de payer de l'argent pour un logiciel. Heureusement, il existe plusieurs excellents programmes gratuits tels que Google Docs Voice Typing (GDVT) et Windows Speech Recognition (WSR)..
Bases de Dragon NaturallySpeaking 13 Bases de Dragon NaturallySpeaking 13 Acheter maintenant chez Amazon 11,00 $
Vous vous demandez peut-être comment ces deux produits se comparent au DNS - et si le DNS répond ou non à vos besoins. Pour cet article, j’ai identifié trois types d’utilisateurs: ceux qui ont besoin de la transcription parole-texte pour écrire des romans, ceux qui ont besoin transcription académique, et ceux qui écrivent documents commerciaux, comme des mémos. À cette fin, j'ai testé trois programmes de transcription vocale (DNS, GDVT et WSR)..
Configuration de la transcription de la parole
Avant de commencer le test, examinons d’abord la configuration matérielle et logicielle recommandée..
Configuration matérielle et logicielle requise
La saisie vocale dans Google Documents nécessite le navigateur Chrome et un microphone. Et il nécessite également une connexion Internet persistante (qui n'est pas mentionnée dans les exigences). Sinon, c’est probablement la méthode la plus simple pour débuter avec la transcription vocale..
DNS nécessite un processeur créé en 2001 ou une version ultérieure, Windows 7 ou une version ultérieure et environ 4 Go de stockage gratuit. Son exigence la plus stricte est 2 Go de RAM. Voici une liste complète de la configuration matérielle requise par DNS.
Reconnaissance vocale Windows Activer le contrôle de la parole en texte et le contrôle vocal en configurant la reconnaissance vocale dans Windows Activer le contrôle de la parole en texte et le contrôle vocal en configurant la reconnaissance vocale dans Windows La reconnaissance vocale reste plus puissante que Cortana. Il conduit la parole à texte et le contrôle de la voix. Cet article vous montrera ce que la reconnaissance vocale peut faire, comment la configurer, la former et l’utiliser. Read More, également appelé Speech Platform Runtime (téléchargement WSR), ne coûte rien et ne nécessite qu'un système d'exploitation Windows 7 ou version ultérieure..
Considérations sur le microphone
J'utilise un microphone dynamique (meilleur microphone pour la baladodiffusion. Le meilleur microphone podcast pour votre argent en 2017. Le meilleur microphone podcast pour votre argent en 2017. Les microphones comptent beaucoup pour la création d'un podcast. Les coûts initiaux sont relativement faibles: logiciel d'enregistrement, ordinateur portable, et bien sûr, un microphone. Alors, quel est le meilleur microphone de podcast? En savoir plus) et un processeur Intel Core i7 relativement rapide. Bien qu'un microphone de haute qualité soit souhaité, il n'est pas nécessaire. Néanmoins, vos résultats s'amélioreront avec une meilleure qualité sonore et une réduction du bruit de fond..
Le microphone le moins cher que je recommanderais pour un enregistrement de haute qualité est Audio-Technica ATR-2100. Cependant, la différence de précision entre un microphone à 5 $ et un appareil à 200 $ est assez minime..
Audio-Technica ATR2100-USB Microphone dynamique USB / XLR cardioïde Audio-Technica ATR2100-USB Microphone dynamique USB / XLR cardioïde Acheter maintenant sur Amazon
D'autre part, la configuration minimale requise pour Microsoft Speech concerne à peu près n'importe quel ordinateur distant (la plupart des ordinateurs fabriqués au cours des dix dernières années) et un microphone. Si vous possédez un ordinateur portable ou une tablette fabriqué au cours des cinq dernières années, il devrait disposer de ce dont vous avez besoin par défaut.
Configuration des programmes de transcription vocale
Voici comment utiliser Google Voice Typing:
Voici comment démarrer avec la reconnaissance vocale Windows:
Et enfin, voici comment démarrer avec Dragon Naturally Speaking:
Méthodologie de test
Je veux trouver le meilleur libre Application de synthèse de la parole en texte basée sur Windows. Parce que différents consommateurs peuvent avoir besoin d'un produit différent, j'ai conçu un test simple. J'ai lu trois passages différents de textes sans copyright: un de Charles Darwin Sur la tendance des espèces à former des variétés. Un de H.P. De Lovecraft Appel de cthulu. La dernière vient du discours de Jerry Brown sur l'état de l'Union en 2017. Ma méthodologie n’est certes pas parfaite, mais elle donne une idée de la précision de chaque suite de reconnaissance vocale..
Échantillon d'écriture de fiction (de H.P. Lovecraft's Appel de cthulu)
“La chose la plus miséricordieuse au monde, je pense, est l'incapacité de l'esprit humain à corréler tous ses contenus. Nous vivons sur une île d'ignorance placide au milieu des mers noires de l'infini, et cela ne voulait pas dire que nous devions voyager loin. Les sciences, chacune dans sa propre direction, nous ont jusqu'ici peu fait de mal; mais un jour le rapprochement de connaissances dissociées ouvrira des perspectives si terrifiantes de la réalité et de notre position effrayante, que nous deviendrons fous de la révélation ou fuirons la lumière mortelle dans la paix et la sécurité d'un nouvel âge sombre.”
Échantillon de rédaction commerciale (discours de Jerry Brown sur l'état de l'Union 2017)
“Il est de coutume à une occasion comme celle-ci d’établir un programme spécifique pour l’année à venir. Six fois avant cette tribune, j’ai fait cela et avec quelques détails. Et, alors que je relisais les propositions exposées dans les discours précédents sur l’État, j’ai été étonné de voir tout ce que nous avons accompli ensemble..”
Échantillon d'écriture académique (Charles Darwin's Sur la tendance des espèces à former des variétés)
“Or, lorsqu'une variété d'un tel animal se présente, avec un pouvoir ou une capacité accru dans un organe ou un sens, cette augmentation est totalement inutile, n'est jamais appelée à agir et peut même exister sans que l'animal en prenne jamais conscience. Au contraire, chez l'animal sauvage, toutes ses facultés et son pouvoir étant pleinement mis en œuvre pour satisfaire les nécessités de la vie, toute augmentation devient immédiatement disponible, renforcée par l'exercice et doit même modifier légèrement la nourriture, les habitudes et le tout. économie de la course.”
3 suites de transcription vocale testées
Il est étonnant de voir à quel point la reconnaissance vocale est libre. Les meilleures applications de création de liste pour les commandes vocales Les meilleures applications de création de liste pour les commandes vocales De nombreux outils de productivité gratuits prennent en charge la synthèse vocale des listes. Nous vous montrerons les meilleures applications de création de liste avec reconnaissance vocale et commandes à essayer. Lire plus de tests effectués sur des logiciels payants. Mais au bout du compte, l’application la plus précise est Dragon Naturally Speaking. Cependant, Google Voice Typing et Windows Speech Recognition ne coûtent rien et offrent une précision de plus de 90%. Mais chacun a ses forces et ses faiblesses et vous pourriez préférer l'une plutôt que l'autre.
H.P. Lovecraft (test d'écriture de fiction)
Lovecraft adorait écrire dans une longue prose ininterrompue et parenthétiquement dense. Bien que les trois suites fassent un excellent travail de transcription précise du texte vocalisé de Lovecraft, DNS devance ses concurrents. Il inclut à la fois la capitalisation et la ponctuation (ce qui est complètement fou).
DNS: Le DNS a seulement laissé tomber un mot du texte. Au total, il a marqué 107 corrects sur 108 mots. Il a également cloué plusieurs longues phrases non-stop.
WSR: Windows a fait un très bon travail - mais pas étonnant - de transcription de Lovecraft. Il comprend environ 97 mots sur 108 mots corrects. Bien que cela ne corresponde pas à la fois à GDVT et à DNS, cela reste bon pour un programme de parole en texte libre qui ne nécessite pas d'accès en ligne.
GDVT: Je ne suis pas sûr de ce qui s'est passé, car Google a cloué la transcription des autres extraits. GDVT n’a obtenu que 103 résultats sur 108, laissant tomber deux mots et dénaturant trois. Il a même une fois précisé “point-virgule” au lieu d'insérer la ponctuation correcte. Il a également mis en majuscule certains mots, en les transformant en noms propres (mais je ne les pénaliserai pas car c'est la précision et non la capitalisation qui compte).
Je suis presque sûr que si je relis le document une seconde fois, il n'y aurait pas d'erreur.
Charles Darwin (test d'écriture scientifique ou académique)
Darwin écrit, comme Lovecraft, de longues phrases remplies d’informations entre parenthèses. Cependant, son usage du langage est très clair et il n’utilise pratiquement pas de jargon, ce qui diffère de l’écriture scientifique presque incompréhensible aujourd’hui..
DNS: Le texte de Darwin est presque parfait dans Dragon Naturally Speaking. DNS a mal orthographié un seul mot (“dans”) et autrement complètement cloué le test avec 87 mots dès 88.
WSR: Microsoft a fait un excellent travail en faisant correspondre 82 mots sur 88. Il a cependant commis des erreurs relativement bizarres, comme l’orthographe “sens” comme “centimes”.
GDVT: Google a bien joué sur l'extrait de Darwin. GDVT n'a incrusté que deux mots sur 88. Globalement, pour une application gratuite, il est impossible de trouver une alternative plus précise..
Jerry Brown Etat de l'Etat Adresse 2016 (test de rédaction commerciale)
Le discours de Brown n'utilise pas beaucoup de phrases ou de vocabulaire compliqués (à part le mot “tribune”). Dans l’ensemble, la plupart des services de transcription ont obtenu des résultats étonnants. Plus ou moins, si vous avez besoin d’un service qui gère des phrases simples et un vocabulaire limité, l’un de ces services fonctionne très bien..
DNS: DNS cloué Brown Etat de l'Etat Adresse. Bien qu’il ait perdu un point, sinon, chaque mot était parfaitement écrit. Notez cependant que les discours politiques manquent souvent du genre de langage complexe que vous pourriez voir dans la fiction ou le monde universitaire. Un mémo ou un discours est direct et direct. C'est quelque chose qu'un client de reconnaissance vocale ne devrait pas avoir de problèmes de traitement.
WSR: La reconnaissance vocale de Windows a fait un excellent travail - bien que pas aussi grand que DNS ou Google - pour transcrire le discours de Brown. Il a marqué 55 sur 58 mots. Il a même reconnu le mot “tribune,” que je ne savais même pas être un mot, je ne savais pas comment le prononcer. Apparemment, j'ai bien compris ou la technologie de reconnaissance vocale peut même détecter les erreurs de prononciation..
GDVT: Le logiciel de transcription de Google a parfaitement réussi la transcription, avec une précision de 100%. Il a même réussi à capitaliser correctement “Etat de l'Etat”, sans avoir besoin de l'entrée de l'utilisateur. Il a curieusement utilisé le nombre, plutôt que l’orthographe, pour le mot “six”. Ce qui a entraîné une erreur stylistique.
Les services de transcription gratuits sont-ils utiles??
Il existe une différence entre Dragon Naturally Speaking, Google Voice Typing et la reconnaissance vocale Windows de Microsoft. Dragon est plus précis que ses concurrents. Cependant, le meilleur programme gratuit en termes de précision est - de loin - le système de frappe vocale de Google. Alors que les services de transcription de Microsoft et de Google se comparent moins favorablement que le DNS, ils ne coûtent pas 30 USD..
Contrairement aux deux services gratuits, Google offre une meilleure précision de la reconnaissance vocale, la ponctuation et le cas où, il nécessite une connexion Internet. Google capture également beaucoup de choses que vous ne souhaitez pas, comme la ponctuation et la capitalisation.
Toutefois, si vous souhaitez un programme de transcription gratuit pour lequel vous n'avez pas besoin d'une connexion Internet, la reconnaissance vocale de Windows convient parfaitement. Windows peut le faire? 15 fonctionnalités surprenantes que vous ne saviez pas que Windows peut faire cela? 15 Fonctions surprenantes que vous ne saviez pas à propos de Windows peuvent faire beaucoup plus que vous ne le pensez. Même si vous êtes un utilisateur expérimenté de Windows, je parie que vous découvrirez une fonctionnalité de notre liste que vous ne saviez pas qu'elle existait. Lire la suite . Ce n'est pas mauvais et offre 90% de ce que Dragon Naturally Speaking propose. Essayez si vous ne l'avez pas déjà fait.
Et pour ce faire sur votre téléphone Android, consultez les meilleures applications Android de synthèse vocale 7 Les meilleures applications de dictée Android pour une synthèse vocale aisée 7 Les meilleures applications de dictée Android pour une synthèse vocale aisée Vous recherchez le meilleur discours- des applications de texte pour Android? Ces applications de dictée Android vous permettent de prendre des notes et plus encore. Lire la suite .
Quel est votre service de transcription préféré? S'il vous plaît laissez-nous savoir dans les commentaires!
En savoir plus sur: Reconnaissance vocale, Discours en texte.